Я сам тоже прошёлся по всем 24 линкам, чтобы проверить ещё раз, что все линки работают как надо. Вроде всё чётко, ни одной 404-ой ошибки или "протухшего" домена не обнаружено. Но что меня сразу, мягко говоря, неприятно удивило, так это то, что до сих пор, уже более десятилетия в XXI веке, более 20 лет без СССР существования Юникода, чуть-ли не половина сайтов в списке хостают свой контент в CP1251 претендуя при этом на якутский язык. Дело в том, что в якутском алфавите 40 букв, представленных 38-ю символами из набора Кириллицы. Но не все они представлены в кодовой странице CP1251, про которую знают операционные системы и веб-браузеры. Поэтому те буковки, которые не входят в CP1251 приходится кодировать каждую отдельно в виде HTML мнемоники, как например "Ǯ" вместо Ҕ. Это расточительно в плане трафика, это может вызвать проблемы при повторном редактировании текста, это с трудом индексируется для поиска. Но это ещё пол-беды. То что, в интернете буквы представлены их цифровым кодом в Юникоде, намекает на то, что всё-таки, сам источник информации (статьи написанные их авторами) закодирован, скорее всего, в Юникоде. И при желании, и небольшом усилии, кодировку на веб-сайтах ещё можно починить, а данные переконвертировать.
Самое веселье начинается, когда под видом CP1251 на самом деле используется своя, суррогатная кодировка, которая частично повторяет CP1251, но полностью с ней не совпадает, следовательно, на самом деле, уже не CP1251. И чтобы запутать браузер окончательно, и чтобы он графически отображал на экране примерно правильную картинку, используются всяческие трюки. Простейший - это попросить пользователя, возможно совершенно случайно проходившего мимо, сходить на специальную страницу, загрузить и (!) проинсталлировать в свою систему специальные шрифты, предназначенные для просмотра только этого конкретного веб-сайта. Другой способ, похитрее - это прописать на каждой странице вебсайта инструкции для браузера, какие шрифты использовать и где их взять. По сути, проделать всё, что описано в первом способе, только без участия (и без согласия) пользователя. Ладно, мне подгрузить несколько бесплатных мегабайт за кулисами трафика может и не составит больших хлопот (а кому-то моежет быть и не ладно). Но если вы хотите, чтобы ваши публикации вобще хотя бы как-то индексировались в поисковых системах, чтобы ваши читатели имели возможность искать в тексте слова без учёта регистра или напечатать страницу на принтере, ну или просто чтобы ваш сайт открывался не только в персональных компьютерах, но и в телефонах и в других мобильных устройтсвах, то я бы сказал не стоит идти таким "своим путём".
А каким путём правильно? Если вы и ваши пользователи используют программное обеспечение от ведущих производителей, таких как Microsoft, Mozilla, Apple, Opera и т.д., то и следовать надо станадартам, которые все они поддерживают. Так вот, единственная принятая мировой промышленностью система кодирования текста, на сегодняшний день и, пожалуй, в более или менее обозримом будущем, в которой предусмотрено место для якутского алфавита - это Юникод. Других вариантов просто нет.
А как перейти на Юникод? Для тех, кто любит создавать вещи по правилам и не дрогнет перед необходимостью для этого предварительно переработать массу теории, есть великолепная статья на сайте W3 Консорциума "Переход на Unicode". А если вкратце, то можно для начала просто попробовать в мета-тэг "Content-Type" вставить значение "text/html; charset=UTF-8", и посмотреть что получится сломается. А дальше уже плясать вокруг этого. Скорей всего, придётся кое-что еще подкрутить там и сям, в настройках базы данных и т.д. Но это уже, как говорится, дело техники, и зависит от вашей платформы.
А вот, собственно, сам список...
- www.sakhaopenworld.org/media/ - The Sakha National Broadcasting TV Programs (selected).
- uhhan.ru - The website of Ivan Uhhan, writer, public speaker. Some texts in Russian
- www.sakhatyla.ru - SakhaTyla.ru, the Sakha language website with Russian-Sakha and Sakha-Russian online dictionaries, Pekarsky's Sakha Language Dictionary (graphic), a text-book for the Russian-speakers, the Sakha language grammer book, samples of the Sakha folklore texts and songs.
- www.kyym.ru - The Kyym Sakha-Language News Agency. Please don't confuse with the newspaper of the same name. This one is a seperate online project. Kyym.ru publishes stories in the Sakha language from different media outlets.
- sakhasire.ykt.ru - (Not in Unicode) The online version of the Sakha Sire republic governmental newspaper.
- news.iltumen.ru - (Not in Unicode) IL Tumen News, online version of the republic parliament newspaper. Published in Russian and Sakha languages.
- sah.wikipedia.org - Wikipedia in the Sakha language.
- sah.wikisource.org - Wikisource in the Sakha language.
- www.viktoriasakha.ru - (Not in Unicode) Sakha Viktoria FM Radio Station.
- bertjickty.narod.ru - (Not in Unicode) Bert Jickty's website, he is a big promoter of the Sakha fonts on the Internet.
- www.baayaga.narod.ru - (Not in Unicode) Unofficial website of the Bayaga settlement of Yakutia's Tattinsky region.
- olonkho-yak.my1.ru - Private website dedicated to the Olonkho, the Sakha heroic epos.
- tylbaas.ykt.ru - Online dictionary: Sakha-Russian, Russian-Sakha
- 42.ykt.ru/edersaas/ - (Not in Unicode) Eder Saas Newspaper archive.
- www.bichik.ru - (Not in Unicode) Bichik National Publishing House. Partly in Russian.
- khohuun.h1.ru - (Not in Unicode) Khohuun NGO newspaper
- pages.ykt.ru/tumus/index_sa.html - Public speaker Tumus Mekhaale
- sitim.ykt.ru/sakha/ - Sakhalyy Sitim NGO.
- il.ucoz.net - Sakha Non-Governmental Centre. Partly in the Sakha language.
- ilin-yakutsk.narod.ru/index.htm - (Not in Unicode) ILIN, historical & cultural magazin.
- tymen.org.ru - Tumen Youth Organization.
- sanaalar.ru - Sakha Music Website supported by Sinilga and Qwer
- eyge.sakha.ru - (Not in Unicode) Eyge, website for the deliberated Sakha man, as it says in the header.
- altan.naslegy.ru - Website of the Altan settlement, a pioneer among Sakha-language websites.
Пожалуй, стоит упомянуть, что за основу был взят список, сформированный года два назад посетителями форума http://sanaalar.ru/forum/index.php
ОтветитьУдалитьАдмин Qwer
Что касается основной темы поста, безусловно она актуальна для многих языков России и постсоветского пространства, использующих кириллицу.
ОтветитьУдалитьКостыли, которые были придуманы умельцами не от хорошей жизни, прижились. И их не так то легко заставить исчезнуть.
Например, руководитель главного республиканского информагенства мне сказала на полном серьезе, что перешла бы на юникод хоть завтра - но в редакциях северных улусов не смогут прочитать и соответственно перепечатать информацию в своих газетах.
В Удмуртии этой весной провели т.н. цифровой субботник. На базе университета пригласили всех желающих прийти и бесплатно поменять раскладки на ноутбуках. А также показали как переделать сайты. Внятных итогов акции услышать не довелось, но проблему подняли и по крайней мере сообщали, что один сайт был переведен (после к организаторам обращались за техподдержкой).
ОтветитьУдалитьПравильно говорит руководитель. Дело это серьёзное и требует тщательный системный анализ. Редакции северных улусов, будь они хоть подчинёнными подразделениями или независимыми клиентами, в любом случае, они являются неотьемлемым компонентом всей информационной системы, или другими словами, частью инфраструктуры. Это живое производство, и подход "хоть завтра" тут не сработает. Но это не должно означать, что переход неосуществим. Просто нужен план, бюджет и человеческие ресурсы. Но, я думаю, чем раньше это начинать, тем меньше будут затраты и существеннее отдача. Ну и конкуренты ведь, обычно не дремлют.
ОтветитьУдалитьМне кажется, что все-таки, не в северных улусах и их технической отсталости дело... Просто никому до этого дела нет. Может слишком мелкий масштаб проблемы, а может еще не узрели, что бабки можно срубить...
ОтветитьУдалитьесть еще один сайт, якутская версия ЯСИА: http://www.ysia.ru/lang.php?lang=2
ОтветитьУдалитьеще в список не попал наш проект с форумами на якутском языке
ОтветитьУдалитьhttp://sakha.ykt.ru
Спасибо amginskiy за линк. Надо будет Болоту сказать, может тоже захочет добавить в свой список. Но к сожалению, там тоже не-Юникод, и что печальней всего, кракозябры вместо букв. И это государственный информационный орган республики!
ОтветитьУдалитьphront тоже спасибо.
ОтветитьУдалитьВесьма актуальный вопрос. Вроде бы техническая деталь, но очень и очень важная.
ОтветитьУдалитьhttp://sakhasire.ykt.ru юникодка көспүттэр
ОтветитьУдалить