Информационный портал
pocket versionPOCKET  wikiWIKI  FAQFAQ  ПоискПоиск  ПользователиПользователи  ГруппыГруппы  РегистрацияРегистрация  ПрофильПрофиль  Войти и проверить личные сообщенияВойти и проверить личные сообщения  ВходВход

Дореволюционная буква "е"
На страницу Пред.  1, 2
 
Найти сообщения без ответов
Начать новую тему   Ответить на тему    Список форумов www.fictionbook.org -> Основы формата FB
Предыдущая тема :: Следующая тема  
Автор Сообщение


Bailo
Координатор проекта «Испр@влено»

Координатор проекта «Испр@влено»

Зарегистрирован: 22.10.2004
Сообщения: 810
Откуда: Москва

СообщениеДобавлено: Ср Окт 26, 2005 18:11    Заголовок сообщения: Ответить с цитатой

b0ris писал(а):
а если не купят - то так раздавать

Классный подход. В вас умер великий маркетолог (или не умер?)
Семаргл писал(а):
Вообще говоря эти символы в юникоде предусмотрены - от 0х0460 по 0х048F

Это известно. Проблема в том, что читалка не поддерживает такие шрифты, поэтому и отображается все квадратиками.

ЗЫ: Так что ждем и надеемся, что кто-нибудь сядет за переписывание Haali Reader'а под нужды нового времени.
_________________
If things go wrong you don't have to go with them
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail


fi
Новенький участник форума

Новенький участник форума

Зарегистрирован: 01.11.2005
Сообщения: 11

СообщениеДобавлено: Ср Авг 16, 2006 18:29    Заголовок сообщения: Ответить с цитатой

Bailo писал(а):
Shaman писал(а):
А хрен его знает, как надо правильно. Непонятно. По хорошему, книга должна содержать шрифты.

Хороший ответ. Содержательный Laughing (без обид).
Сейчас пытаюсь переделать из pdf дореволюционное издание одного нобелевского лауреата - вот думаю, стоит ли игра свеч, потому что дай бог в rtf книга будет правильно отображаться. Тогда зачем я ее в fb2 делать буду?
Я очень согласен с тем, что при замене "ять" на "е" потеряется всякий цимус. Так что жду предложений - плюнуть или не плюнуть?


Лучше, на мой взгляд, использовать для определения &yat; как <!ENTITY yat & # 1123 ;> и заменять на его для PDA
Вернуться к началу
Посмотреть профиль Отправить личное сообщение


Alan
Автор ридера Alreader и клона Haali


Зарегистрирован: 25.01.2005
Сообщения: 421

СообщениеДобавлено: Ср Авг 16, 2006 20:11    Заголовок сообщения: Ответить с цитатой

а что нельзя просто написать & # 1123 ? Если шрифт содержит символ - будет отображено, если нет - квадрат, к читалки это все равно ровным счетом никакого отношения не имеет...
Вернуться к началу
Посмотреть профиль Отправить личное сообщение


Гепард
Постоянный участник форума

Постоянный участник форума

Зарегистрирован: 28.06.2006
Сообщения: 624
Откуда: Кемерово

СообщениеДобавлено: Сб Авг 19, 2006 15:56    Заголовок сообщения: Ответить с цитатой

Bailo писал(а):
Кстати, сразу обнаружил, что данная буква отображается только в некоторых (юникодовских?) шрифтах.

Каких именно? Да в обычном браузере один только заголовок этой книги уже неудобочитаем (Я решил, что комп заглючил, чего с ним отродясь не водилось), ан-нет - и текст там такой же (Книга Даля)
pdv писал(а):
Пример такого текста есть в библиотеке: книга Даля О предрассудках... На КПК читать невозможно - сплошные квадраты вместо букв. Я считаю, что пока решение не найдено - смысла готовить такие тексты нет.

Поддерживаю! Интересно, в чем эта книга готовилась? Автор что, не видел результата? Или у него все нормалек? Тогда как онг этого добился? Я Даля себе тоже скачал, выматерился, и выкинул ее нахрен! Evil or Very Mad Так и не понял, чего с ней делать.
Семаргл писал(а):
Другое дело - шрифт с ними нужен (например Arial Unicode)

Да? И как его включить? А ежели мне не только читать, но и поработать надо с отдельными кусками текста, тогда - конвертировать из FB2 во что-нибудь поддающееся редактированию... Результат себе представляешь? Нет? А попробуй!
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Посетить сайт автора


Владимир A
Новенький участник форума

Новенький участник форума

Зарегистрирован: 16.08.2005
Сообщения: 90
Откуда: Мскв.

СообщениеДобавлено: Вс Авг 20, 2006 13:01    Заголовок сообщения: Ответить с цитатой

Вот тут (http://www.ccel.org/contrib/ru/xml/) ребята работают с церковно-славянскими шрифтами в fb2, может их спросить?
Вернуться к началу
Посмотреть профиль Отправить личное сообщение


Гепард
Постоянный участник форума

Постоянный участник форума

Зарегистрирован: 28.06.2006
Сообщения: 624
Откуда: Кемерово

СообщениеДобавлено: Вс Авг 20, 2006 13:10    Заголовок сообщения: Ответить с цитатой

Владимир A

Спасибо! Оч. хорошая сцылка! Счас попробую этот шрифт...

Добавлено спустя 10 минут 29 секунд:

Увы все ссылки в библиотеке FB на книгу Даля - нерабочие - ничего не могу скачать Crying or Very sad Думал глюк - нет, другие книги закачиваются нормально. Придется с этого сайта что-то взять...

Добавлено спустя 15 минут 5 секунд:

Их книги (на указанном сайте) с (цсл) читаются с помощью их же шрифта замечательно! Однако ж в старом архиве у себя раскопал-таки эту книгу Даля - там как были квадраты, так и остались, только с этим шрифтом квадраты стали перечеркнутые крестом. До сих пор в недоумении, кто и зачем "ваял" эту книгу, и как ее читать? По смыслу догадываться? Удалять такие книги надо из библиотеки вместе с ссылками на них! Twisted Evil
_________________
Все познаётся в сравнении.
http://liaclub.info/
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Посетить сайт автора


albor
Новенький участник форума

Новенький участник форума

Зарегистрирован: 11.03.2005
Сообщения: 9
Откуда: Н-ск

СообщениеДобавлено: Вс Сен 17, 2006 6:57    Заголовок сообщения: Ответить с цитатой

Гепард писал(а):
Интересно, в чем эта книга готовилась?


Там в description написано в чём — сначала генерировалась из pdf самописным скриптом на perl, потом ручная доводка в SciTE.


Гепард писал(а):
Автор что, не видел результата? Или у него все нормалек? Тогда как онг этого добился?


Автор (т.е. я) результат видел и остался им вполне доволен.
А добился он этого установкой в HR шрифта Palatino Linotype (на мой взгляд оптимального шрифта для чтения текстов в старой орфографии), который входит в состав Windows.


Гепард писал(а):
Увы все ссылки в библиотеке FB на книгу Даля - нерабочие - ничего не могу скачать Думал глюк - нет, другие книги закачиваются нормально.


А чем качаешь? Opera 8.54 и FF под WinXP всё нормально скачивает.


Гепард писал(а):
Однако ж в старом архиве у себя раскопал-таки эту книгу Даля - там как были квадраты, так и остались, только с этим шрифтом квадраты стали перечеркнутые крестом. До сих пор в недоумении, кто и зачем &quot;ваял&quot; эту книгу, и как ее читать?


«Ваял» я. Для читателей, естественно. Хотя не только — хотел ещё на реальной книге протестировать пригодность fb2 для русских книг со старой орфографией.

Cамим форматом остался доволен, однако выплыли проблемы с библиотекой и читалками.

В библиотеке нужно поправить таблицу транслитерации имён файлов (я ещё какие-то проблемы замечал, но увы, уже не помню какие). Таблицу могу поправить и я (она мне где-то тут попадалась даже вроде), но только для европейских языков.

С читалками сложнее.
В HR достаточно выставить шрифт, подойдут: Palatino Linotype, Arial Unicode MS, Lucida Sans Unicode и Code2000 (и много других, но они менее распространены). В CoolReader то же самое.
Остальные читалки не тестировались. Wink

Добавлено спустя 56 минут 4 секунды:

Да, забыл сказать, мне тут уже высказывались претензии, что мол даже и с «правильным» шрифтом старую орфографию читать затруднительно, поэтому ещё зимой я озадачился опцией автоматической «конвертации» в современную орфографию в HR, благо исходники открыты.

До ума я это не довёл, т.к. копаясь в исходниках очень многое хотелось поменять… Wink Менял, менял, а потом слетел винт и все мои изменения накрылись вместе с ним…

Восстанавливать всё это я уже не буду, ибо сильно не люблю C и прочие низкоуровневые языки, но остались какие-то промежуточные бинарники, которые знакомым потестировать высылал, если они кому-нибудь вдруг интересны — могу выложить.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение


Гепард
Постоянный участник форума

Постоянный участник форума

Зарегистрирован: 28.06.2006
Сообщения: 624
Откуда: Кемерово

СообщениеДобавлено: Вс Сен 17, 2006 10:02    Заголовок сообщения: Ответить с цитатой

albor писал(а):
шрифта Palatino Linotype (на мой взгляд оптимального шрифта для чтения текстов в старой орфографии), который входит в состав Windows.



Попробовал - получилось все отлично! Спасибо!
(Где ж ты раньше был, целовался с кем...) Smile

(Я ведь и половины шрифтов не знаю, пользуюсь как большинство - самыми распространенными)

Теперь текст выглядит очень читабельно - просто отлично, а вот в библиотекаре косяк остался - квадраты там никуда не делись. Crying or Very sad НО это уже не к тебе. (Вот уж действительно - век живи - век учись) Laughing Еще раз спасибо.

Добавлено спустя 2 минуты 38 секунд:

albor писал(а):
Да, забыл сказать, мне тут уже высказывались претензии, что мол даже и с «правильным» шрифтом старую орфографию читать затруднительно, поэтому ещё зимой я озадачился опцией автоматической «конвертации» в современную орфографию в HR, благо исходники открыты.


Да зачем заморачиваться-то? Просто в аннотации к книге добавить пару строк рекомендаций по переключению шрифта в читалке, и все.

Добавлено спустя 9 минут 33 секунды:

P.S. А у кого проблемы с
Цитата:
"правильным"
шрифтом - пусть в системе покопаются... А то наставят программ кучу всяких, а там конфликт на конфликте. Это ж Windows! Wink Кстати, есть программа, помогающая решить многие проблемы с конфликтами шрифтов - FontExpert 2004. У меня в пижамкине были - сейчас зато все в порядке.
_________________
Все познаётся в сравнении.
http://liaclub.info/
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Посетить сайт автора


_PG_
Новенький участник форума

Новенький участник форума

Зарегистрирован: 31.05.2007
Сообщения: 5

СообщениеДобавлено: Ср Окт 08, 2008 16:53    Заголовок сообщения: Ответить с цитатой

Попробовал скачать текстик из этой библиотечки церковно-славянской литературы (цсл) (http://www.ccel.org/contrib/ru/xml/), должен заметить, что ни один из перечисленных шрифтов (Palatino Linotype, Arial Unicode MS, Lucida Sans Unicode) не позволяет прочитать тамошние тексты. Яти и еры заменяются чёрти-чем. Похоже, ребята делали свой специфический шрифт отнюдь не ориентируясь на юникодный стандарт, так что в уме их держать можно, но ориентироваться на их подход не стоит.

А есть ли у кого-нибудь опыт сканирования дореволюционной орфографии &quot;по уму&quot;, чтобы текст соответствовал юникодным стандартам? Есть ли какая-то инструкция или рекомендации, как это делать?

У меня на руках есть скан (набор jpg) достаточно редкой книги, хотелось бы из нее грамотно сделать pdf, fb2 и html. Не хотелось бы погубить дело из-за нерационального подхода к задаче.

Добавлено спустя 6 минут 54 секунды:

pdv писал(а):
Пример такого текста есть в библиотеке: книга Даля О предрассудках... На КПК читать невозможно - сплошные квадраты вместо букв. Я считаю, что пока решение не найдено - смысла готовить такие тексты нет.
А можно конкретнее, о какой именно книге идет речь?
Вернуться к началу
Посмотреть профиль Отправить личное сообщение


nbl
Новенький участник форума

Новенький участник форума

Зарегистрирован: 13.12.2007
Сообщения: 27

СообщениеДобавлено: Чт Окт 09, 2008 3:51    Заголовок сообщения: Ответить с цитатой

Там старославянский язык и для чтения нужен специальный шрифт, ссылка на который там же и дана.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение


VladK
Новенький участник форума

Новенький участник форума

Зарегистрирован: 15.07.2008
Сообщения: 57

СообщениеДобавлено: Чт Окт 09, 2008 11:17    Заголовок сообщения: Ответить с цитатой

_PG_ писал(а):
А есть ли у кого-нибудь опыт сканирования дореволюционной орфографии &amp;quot;по уму&amp;quot;, чтобы текст соответствовал юникодным стандартам? Есть ли какая-то инструкция или рекомендации, как это делать?

Да, есть (опыт). Я сам сканировал и распознавал дореволюционные издания. Сканировал и распознавал Файнридером (еще 5-м или 6-м, точно не помню), там был &quot;старорусский&quot; язык или что-то в этом роде. Правил Вордом. Получался нормальный юникод.
О том, как будут воспринимать его читалки (КПКшные) я сейчас как раз занимаюсь - перевожу эти тексты из DOC и HTML в fb2.
Шрифт для ПК - Palatino прекрасно подходит и начертание похоже на старые книги. О результатах - доложу здесь.

Добавлено спустя 19 минут 56 секунд:

Прекрасно всё получилось - загрузил на КПК Palatino положил файл в fb2 открыл haali сменил шрифт и читал яти и еры, фиты и ижицы Very Happy
Желающие посмотреть - http://lib.rus.ec/b/123799 и http://lib.rus.ec/b/123800
Вернуться к началу
Посмотреть профиль Отправить личное сообщение


_PG_
Новенький участник форума

Новенький участник форума

Зарегистрирован: 31.05.2007
Сообщения: 5

СообщениеДобавлено: Пт Окт 10, 2008 10:21    Заголовок сообщения: Ответить с цитатой

Отлично. С веб они там читаются тоже хорошо.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение


VladK
Новенький участник форума

Новенький участник форума

Зарегистрирован: 15.07.2008
Сообщения: 57

СообщениеДобавлено: Пт Окт 10, 2008 11:27    Заголовок сообщения: Ответить с цитатой

Дополнение (для тех, кто хотел "инструкцию"):

В Файнридере нужно загрузить (с сайта, если нет на родном диске) "дополнительные языки" и там есть "Русский (старая орфография)".

Проблема, с которой я столкнулся при плохом качестве оригиналов (а где сейчас найти хорошие оригиналы?) - ФР путает ять с твердым знаком. Sad
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
Показать сообщения:   
Начать новую тему   Ответить на тему    Список форумов www.fictionbook.org -> Основы формата FB Часовой пояс: GMT + 3
На страницу Пред.  1, 2
Страница 2 из 2

 
Перейти:  
Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах


Powered by phpBB © 2001, 2005 phpBB Group