Как конвертировать текст ANSEL в UTF-8

Как изменить текст, закодированный в ANSEL в UTF-8 в C #?

11.12.2008 16:21:08
3 ОТВЕТА
РЕШЕНИЕ

Это нетривиальное преобразование, поскольку в Windows / .NET Framework нет кодовой страницы ANSEL. Смотрите здесь о страданиях другого человека, пытающегося это преобразование.

3
11.12.2008 16:31:15

Джошперри прав. Сайт Эйхмана в основном содержит ЕДИНСТВЕННУЮ документацию, которая пытается объяснить кодировку ANSEL. К сожалению, там нет кода программы, поэтому вам придется кодировать его самостоятельно.

Существует еще одна кодовая таблица (датированная декабрем 2007 года - я не знала, что кто-то все еще заинтересован) для ANSEL по адресу: http://lcweb2.loc.gov/diglib/codetables/45.html, с которой стоит сравнить работу Эйхмана, поскольку он признал, что есть несколько кодов, в которых он не уверен.

Если вы заинтересованы с точки зрения генеалогии, стандартный выпуск GEDCOM 5,5 имеет сокращенный набор ANSEL символов и некоторые кодировки в его Приложении D .


Обновление, сентябрь 2017 года. Спустя много времени после моего первоначального ответа на этот вопрос, Тамура Джонс написал отличную серию статей об ANSEL, которые стоит проверить:

1
15.09.2017 22:14:07
Взгляните на код преобразования Gramps ANSEL в Unicode github.com/gramps-project/gramps/blob/…
Sam 14.09.2017 22:15:32

Существует класс AnselEncoding (производный от стандартного класса Encoding), доступный как часть Gedcom.NET по адресу http://sourceforge.net/projects/gedcom-net/, который также включает поддержку некоторых расширений LDS.

1
22.08.2009 17:42:24