Предыдущая тема :: Следующая тема |
Автор |
Сообщение |
Bailo Координатор проекта «Испр@влено»
Зарегистрирован: 22.10.2004 Сообщения: 810 Откуда: Москва
|
Добавлено: Ср Окт 26, 2005 18:11 Заголовок сообщения: |
|
|
b0ris писал(а): | а если не купят - то так раздавать |
Классный подход. В вас умер великий маркетолог (или не умер?)
Семаргл писал(а): | Вообще говоря эти символы в юникоде предусмотрены - от 0х0460 по 0х048F |
Это известно. Проблема в том, что читалка не поддерживает такие шрифты, поэтому и отображается все квадратиками.
ЗЫ: Так что ждем и надеемся, что кто-нибудь сядет за переписывание Haali Reader'а под нужды нового времени. _________________ If things go wrong you don't have to go with them |
|
Вернуться к началу |
|
|
fi Новенький участник форума
Зарегистрирован: 01.11.2005 Сообщения: 11
|
Добавлено: Ср Авг 16, 2006 18:29 Заголовок сообщения: |
|
|
Bailo писал(а): | Shaman писал(а): | А хрен его знает, как надо правильно. Непонятно. По хорошему, книга должна содержать шрифты. |
Хороший ответ. Содержательный (без обид).
Сейчас пытаюсь переделать из pdf дореволюционное издание одного нобелевского лауреата - вот думаю, стоит ли игра свеч, потому что дай бог в rtf книга будет правильно отображаться. Тогда зачем я ее в fb2 делать буду?
Я очень согласен с тем, что при замене "ять" на "е" потеряется всякий цимус. Так что жду предложений - плюнуть или не плюнуть? |
Лучше, на мой взгляд, использовать для определения &yat; как <!ENTITY yat & # 1123 ;> и заменять на его для PDA |
|
Вернуться к началу |
|
|
Alan Автор ридера Alreader и клона Haali
Зарегистрирован: 25.01.2005 Сообщения: 421
|
Добавлено: Ср Авг 16, 2006 20:11 Заголовок сообщения: |
|
|
а что нельзя просто написать & # 1123 ? Если шрифт содержит символ - будет отображено, если нет - квадрат, к читалки это все равно ровным счетом никакого отношения не имеет... |
|
Вернуться к началу |
|
|
Гепард Постоянный участник форума
Зарегистрирован: 28.06.2006 Сообщения: 624 Откуда: Кемерово
|
Добавлено: Сб Авг 19, 2006 15:56 Заголовок сообщения: |
|
|
Bailo писал(а): | Кстати, сразу обнаружил, что данная буква отображается только в некоторых (юникодовских?) шрифтах. |
Каких именно? Да в обычном браузере один только заголовок этой книги уже неудобочитаем (Я решил, что комп заглючил, чего с ним отродясь не водилось), ан-нет - и текст там такой же (Книга Даля) pdv писал(а): | Пример такого текста есть в библиотеке: книга Даля О предрассудках... На КПК читать невозможно - сплошные квадраты вместо букв. Я считаю, что пока решение не найдено - смысла готовить такие тексты нет. |
Поддерживаю! Интересно, в чем эта книга готовилась? Автор что, не видел результата? Или у него все нормалек? Тогда как онг этого добился? Я Даля себе тоже скачал, выматерился, и выкинул ее нахрен! Так и не понял, чего с ней делать. Семаргл писал(а): | Другое дело - шрифт с ними нужен (например Arial Unicode) |
Да? И как его включить? А ежели мне не только читать, но и поработать надо с отдельными кусками текста, тогда - конвертировать из FB2 во что-нибудь поддающееся редактированию... Результат себе представляешь? Нет? А попробуй! |
|
Вернуться к началу |
|
|
Владимир A Новенький участник форума
Зарегистрирован: 16.08.2005 Сообщения: 90 Откуда: Мскв.
|
Добавлено: Вс Авг 20, 2006 13:01 Заголовок сообщения: |
|
|
Вот тут (http://www.ccel.org/contrib/ru/xml/) ребята работают с церковно-славянскими шрифтами в fb2, может их спросить? |
|
Вернуться к началу |
|
|
Гепард Постоянный участник форума
Зарегистрирован: 28.06.2006 Сообщения: 624 Откуда: Кемерово
|
Добавлено: Вс Авг 20, 2006 13:10 Заголовок сообщения: |
|
|
Владимир A
Спасибо! Оч. хорошая сцылка! Счас попробую этот шрифт...
Добавлено спустя 10 минут 29 секунд:
Увы все ссылки в библиотеке FB на книгу Даля - нерабочие - ничего не могу скачать Думал глюк - нет, другие книги закачиваются нормально. Придется с этого сайта что-то взять...
Добавлено спустя 15 минут 5 секунд:
Их книги (на указанном сайте) с (цсл) читаются с помощью их же шрифта замечательно! Однако ж в старом архиве у себя раскопал-таки эту книгу Даля - там как были квадраты, так и остались, только с этим шрифтом квадраты стали перечеркнутые крестом. До сих пор в недоумении, кто и зачем "ваял" эту книгу, и как ее читать? По смыслу догадываться? Удалять такие книги надо из библиотеки вместе с ссылками на них! _________________ Все познаётся в сравнении.
http://liaclub.info/ |
|
Вернуться к началу |
|
|
albor Новенький участник форума
Зарегистрирован: 11.03.2005 Сообщения: 9 Откуда: Н-ск
|
Добавлено: Вс Сен 17, 2006 6:57 Заголовок сообщения: |
|
|
Гепард писал(а): | Интересно, в чем эта книга готовилась? |
Там в description написано в чём — сначала генерировалась из pdf самописным скриптом на perl, потом ручная доводка в SciTE.
Гепард писал(а): | Автор что, не видел результата? Или у него все нормалек? Тогда как онг этого добился? |
Автор (т.е. я) результат видел и остался им вполне доволен.
А добился он этого установкой в HR шрифта Palatino Linotype (на мой взгляд оптимального шрифта для чтения текстов в старой орфографии), который входит в состав Windows.
Гепард писал(а): | Увы все ссылки в библиотеке FB на книгу Даля - нерабочие - ничего не могу скачать Думал глюк - нет, другие книги закачиваются нормально.
|
А чем качаешь? Opera 8.54 и FF под WinXP всё нормально скачивает.
Гепард писал(а): | Однако ж в старом архиве у себя раскопал-таки эту книгу Даля - там как были квадраты, так и остались, только с этим шрифтом квадраты стали перечеркнутые крестом. До сих пор в недоумении, кто и зачем "ваял" эту книгу, и как ее читать? |
«Ваял» я. Для читателей, естественно. Хотя не только — хотел ещё на реальной книге протестировать пригодность fb2 для русских книг со старой орфографией.
Cамим форматом остался доволен, однако выплыли проблемы с библиотекой и читалками.
В библиотеке нужно поправить таблицу транслитерации имён файлов (я ещё какие-то проблемы замечал, но увы, уже не помню какие). Таблицу могу поправить и я (она мне где-то тут попадалась даже вроде), но только для европейских языков.
С читалками сложнее.
В HR достаточно выставить шрифт, подойдут: Palatino Linotype, Arial Unicode MS, Lucida Sans Unicode и Code2000 (и много других, но они менее распространены). В CoolReader то же самое.
Остальные читалки не тестировались.
Добавлено спустя 56 минут 4 секунды:
Да, забыл сказать, мне тут уже высказывались претензии, что мол даже и с «правильным» шрифтом старую орфографию читать затруднительно, поэтому ещё зимой я озадачился опцией автоматической «конвертации» в современную орфографию в HR, благо исходники открыты.
До ума я это не довёл, т.к. копаясь в исходниках очень многое хотелось поменять… Менял, менял, а потом слетел винт и все мои изменения накрылись вместе с ним…
Восстанавливать всё это я уже не буду, ибо сильно не люблю C и прочие низкоуровневые языки, но остались какие-то промежуточные бинарники, которые знакомым потестировать высылал, если они кому-нибудь вдруг интересны — могу выложить. |
|
Вернуться к началу |
|
|
Гепард Постоянный участник форума
Зарегистрирован: 28.06.2006 Сообщения: 624 Откуда: Кемерово
|
Добавлено: Вс Сен 17, 2006 10:02 Заголовок сообщения: |
|
|
albor писал(а): | шрифта Palatino Linotype (на мой взгляд оптимального шрифта для чтения текстов в старой орфографии), который входит в состав Windows. |
Попробовал - получилось все отлично! Спасибо!
(Где ж ты раньше был, целовался с кем...)
(Я ведь и половины шрифтов не знаю, пользуюсь как большинство - самыми распространенными)
Теперь текст выглядит очень читабельно - просто отлично, а вот в библиотекаре косяк остался - квадраты там никуда не делись. НО это уже не к тебе. (Вот уж действительно - век живи - век учись) Еще раз спасибо.
Добавлено спустя 2 минуты 38 секунд:
albor писал(а): | Да, забыл сказать, мне тут уже высказывались претензии, что мол даже и с «правильным» шрифтом старую орфографию читать затруднительно, поэтому ещё зимой я озадачился опцией автоматической «конвертации» в современную орфографию в HR, благо исходники открыты. |
Да зачем заморачиваться-то? Просто в аннотации к книге добавить пару строк рекомендаций по переключению шрифта в читалке, и все.
Добавлено спустя 9 минут 33 секунды:
P.S. А у кого проблемы с шрифтом - пусть в системе покопаются... А то наставят программ кучу всяких, а там конфликт на конфликте. Это ж Windows! Кстати, есть программа, помогающая решить многие проблемы с конфликтами шрифтов - FontExpert 2004. У меня в пижамкине были - сейчас зато все в порядке. _________________ Все познаётся в сравнении.
http://liaclub.info/ |
|
Вернуться к началу |
|
|
_PG_ Новенький участник форума
Зарегистрирован: 31.05.2007 Сообщения: 5
|
Добавлено: Ср Окт 08, 2008 16:53 Заголовок сообщения: |
|
|
Попробовал скачать текстик из этой библиотечки церковно-славянской литературы (цсл) (http://www.ccel.org/contrib/ru/xml/), должен заметить, что ни один из перечисленных шрифтов (Palatino Linotype, Arial Unicode MS, Lucida Sans Unicode) не позволяет прочитать тамошние тексты. Яти и еры заменяются чёрти-чем. Похоже, ребята делали свой специфический шрифт отнюдь не ориентируясь на юникодный стандарт, так что в уме их держать можно, но ориентироваться на их подход не стоит.
А есть ли у кого-нибудь опыт сканирования дореволюционной орфографии "по уму", чтобы текст соответствовал юникодным стандартам? Есть ли какая-то инструкция или рекомендации, как это делать?
У меня на руках есть скан (набор jpg) достаточно редкой книги, хотелось бы из нее грамотно сделать pdf, fb2 и html. Не хотелось бы погубить дело из-за нерационального подхода к задаче.
Добавлено спустя 6 минут 54 секунды:
pdv писал(а): | Пример такого текста есть в библиотеке: книга Даля О предрассудках... На КПК читать невозможно - сплошные квадраты вместо букв. Я считаю, что пока решение не найдено - смысла готовить такие тексты нет. | А можно конкретнее, о какой именно книге идет речь? |
|
Вернуться к началу |
|
|
nbl Новенький участник форума
Зарегистрирован: 13.12.2007 Сообщения: 27
|
Добавлено: Чт Окт 09, 2008 3:51 Заголовок сообщения: |
|
|
Там старославянский язык и для чтения нужен специальный шрифт, ссылка на который там же и дана. |
|
Вернуться к началу |
|
|
VladK Новенький участник форума
Зарегистрирован: 15.07.2008 Сообщения: 57
|
Добавлено: Чт Окт 09, 2008 11:17 Заголовок сообщения: |
|
|
_PG_ писал(а): | А есть ли у кого-нибудь опыт сканирования дореволюционной орфографии &quot;по уму&quot;, чтобы текст соответствовал юникодным стандартам? Есть ли какая-то инструкция или рекомендации, как это делать?
|
Да, есть (опыт). Я сам сканировал и распознавал дореволюционные издания. Сканировал и распознавал Файнридером (еще 5-м или 6-м, точно не помню), там был "старорусский" язык или что-то в этом роде. Правил Вордом. Получался нормальный юникод.
О том, как будут воспринимать его читалки (КПКшные) я сейчас как раз занимаюсь - перевожу эти тексты из DOC и HTML в fb2.
Шрифт для ПК - Palatino прекрасно подходит и начертание похоже на старые книги. О результатах - доложу здесь.
Добавлено спустя 19 минут 56 секунд:
Прекрасно всё получилось - загрузил на КПК Palatino положил файл в fb2 открыл haali сменил шрифт и читал яти и еры, фиты и ижицы
Желающие посмотреть - http://lib.rus.ec/b/123799 и http://lib.rus.ec/b/123800 |
|
Вернуться к началу |
|
|
_PG_ Новенький участник форума
Зарегистрирован: 31.05.2007 Сообщения: 5
|
Добавлено: Пт Окт 10, 2008 10:21 Заголовок сообщения: |
|
|
Отлично. С веб они там читаются тоже хорошо. |
|
Вернуться к началу |
|
|
VladK Новенький участник форума
Зарегистрирован: 15.07.2008 Сообщения: 57
|
Добавлено: Пт Окт 10, 2008 11:27 Заголовок сообщения: |
|
|
Дополнение (для тех, кто хотел "инструкцию"):
В Файнридере нужно загрузить (с сайта, если нет на родном диске) "дополнительные языки" и там есть "Русский (старая орфография)".
Проблема, с которой я столкнулся при плохом качестве оригиналов (а где сейчас найти хорошие оригиналы?) - ФР путает ять с твердым знаком. |
|
Вернуться к началу |
|
|
|
|
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете голосовать в опросах
|
Powered by phpBB © 2001, 2005 phpBB Group
|