Информационный портал
pocket versionPOCKET  wikiWIKI  FAQFAQ  ПоискПоиск  ПользователиПользователи  ГруппыГруппы  РегистрацияРегистрация  ПрофильПрофиль  Войти и проверить личные сообщенияВойти и проверить личные сообщения  ВходВход

Как отобразить в fb2-документе нестандартные символы?
На страницу 1, 2  След.
 
Найти сообщения без ответов
Начать новую тему   Ответить на тему    Список форумов www.fictionbook.org -> Основы формата FB
Предыдущая тема :: Следующая тема  
Автор Сообщение


Werewolf
Зрелый участник форума

Зрелый участник форума

Зарегистрирован: 12.10.2005
Сообщения: 143

СообщениеДобавлено: Пн Янв 07, 2008 8:23    Заголовок сообщения: Как отобразить в fb2-документе нестандартные символы? Ответить с цитатой

Вопрос чайника в fb2.
В книге, которую я оцифровываю, присутствуют 2 слова в дореволюционной нотации русского языка (для примера - «пѢрѢмѢнно», «к бурѢ»). После распознания они в doc-файле были в виде текста шрифтом Lucida Sans Unicode. После конвертации через doc2fb вместо литер "Ѣ"(т.е. вместо букв "е") оказались квадраты.
Подскажите плз, как мне теперь вставить эти чертовы литеры уже в fb2-формате?
p.s. Использую FBE, но вообще с fb2 начал разбираться совсем недавно, так что инструментарием не вполне владею.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение


Mike Sinkovsky
Зрелый участник форума

Зрелый участник форума

Зарегистрирован: 27.10.2005
Сообщения: 296
Откуда: Пермь

СообщениеДобавлено: Пн Янв 07, 2008 8:58    Заголовок сообщения: Ответить с цитатой

ИМХО проще всего заменить на Ъ (твердый знак в верхнем регистре) - визуально от ятя почти не отличается..

Добавлено спустя 2 часа 6 минут 28 секунд:

Местные гуру наверняка скажут что это не проблема формата - если в настройках читалки выбрать шрифт с полной поддержкой юникода, то скорее всего корректно покажет вместо квадратов яти.
Только 99% читателей этим заморачиваться не будут, просто сотрут файл не читая:
-- просто разбираться лениво
-- далеко не все читалки и конверторы вообще юникод поддерживают
-- юникодный шрифт занимает 15-20 мегабайт памяти, не каждый налажонник такое потянет

В общем на текущем уровне развития софта корректного решения нет.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение


Marina_Ch
Постоянный участник форума

Постоянный участник форума

Зарегистрирован: 14.04.2006
Сообщения: 779
Откуда: Москва

СообщениеДобавлено: Пн Янв 07, 2008 13:28    Заголовок сообщения: Ответить с цитатой

1. Можно копипастнуть данные символы.
2. Можно воспользоваться ФБВ (1.1 - бесплатная версия) функцией вставка символа.
3. Можно в режиме сорцов вставить как юникодный хтмл-символ.
_________________
REB 1100, REB 1200, SE P910i
Вернуться к началу
Посмотреть профиль Отправить личное сообщение


Werewolf
Зрелый участник форума

Зрелый участник форума

Зарегистрирован: 12.10.2005
Сообщения: 143

СообщениеДобавлено: Пн Янв 07, 2008 18:40    Заголовок сообщения: Ответить с цитатой

Mike Sinkovsky
Пожалуй, пока что на Ъ и остановлюсь...

Marina_Ch
1. копипаст не помогает =( Те же квадраты. И в ридере (coolreader) тоже.
2. А где его взять? Нашел пару линков, но битые.
3. Ээээ.... а поподробнее насчет вставки юникодного символа? Я пробовал найти хтмл-ный код "яти", но все те же квадраты. А если напрямую из ворда сохранить кусок с этим словом в хтмл, то там указывается шрифт в теге span.

Доп. вопросы:
1. Какой размер обложки взять? По совету из книги, выложенной где-то тут на форуме, я ограничил 320*240 пикселей, но не очень красиво смотрится.
2. Позволяет ли fb2 сделать буквицы? В моей книге они есть, и довольно неплохие, хотя пока что я их убрал.
3. Марина, видел упоминание о вашей статье по поводу подготовки изображений в фотошопе. Саму статью не нашел. Киньте линк, плз.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение


Marina_Ch
Постоянный участник форума

Постоянный участник форума

Зарегистрирован: 14.04.2006
Сообщения: 779
Откуда: Москва

СообщениеДобавлено: Пн Янв 07, 2008 22:55    Заголовок сообщения: Ответить с цитатой

2. кинь мыло в личку или стукнись в аську - пришлю. Но если только ради одного этого символа ставить ее не стоит. Только если и дальше планируешь пользоваться.
3. & #1122; (без пробела естественно)

по доп.вопросам
1. Посмотри на озоне - у них обложки как раз идеальные по размеру и хорошо смотрятся в либах.
2. Формат позволяет - читалки могут не понять. Тег
Код:
<image l:href="#cover.jpg"/>
можно вставить внутрь тега
Код:
<p>
, но читалки... Sad
3. http://www.fictionbook.org/index.php/Картинки_для_книг_в_формате_FictionBook

Добавлено спустя 2 минуты 10 секунд:

Нормально линк не вставился. Или копипастни ее в браузер, или просто найди ее на той странице, что откроется если пройти по ссылке в разделе Статьи.

Добавлено спустя 12 минут 32 секунды:

Кстати, забыла сказать!
Marina_Ch писал(а):
3. & #1122; (без пробела естественно)

Конечно надо вставлять только в режиме сорцов!
Вернуться к началу
Посмотреть профиль Отправить личное сообщение


Alan
Автор ридера Alreader и клона Haali


Зарегистрирован: 25.01.2005
Сообщения: 421

СообщениеДобавлено: Пн Янв 07, 2008 23:24    Заголовок сообщения: Ответить с цитатой

Marina_Ch
Цитата:
можно вставить внутрь тега
Код:
&lt;p&gt;
, но читалки...


если я ничего не путаю, все актуальные читалки это понимать должны...

Добавлено спустя 3 минуты 49 секунд:

решил проверить... хр, фбр, ср3, ар - понимают... ср2 - нет... 80%


Последний раз редактировалось: Alan (Пн Янв 07, 2008 23:29), всего редактировалось 1 раз
Вернуться к началу
Посмотреть профиль Отправить личное сообщение


Mike Sinkovsky
Зрелый участник форума

Зрелый участник форума

Зарегистрирован: 27.10.2005
Сообщения: 296
Откуда: Пермь

СообщениеДобавлено: Пн Янв 07, 2008 23:28    Заголовок сообщения: Ответить с цитатой

Marina_Ch писал(а):
&#1122;

тогда уж &#1123; -- это строчный ять.
Но в стандарьных шрифтах на наладоннике его нет, будет квадрат.

Инлайн-картинки алридер поддерживает.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение


jurgennt
Зрелый участник форума

Зрелый участник форума

Зарегистрирован: 15.10.2006
Сообщения: 272
Откуда: Харьков

СообщениеДобавлено: Пн Янв 07, 2008 23:39    Заголовок сообщения: Ответить с цитатой

Цитата:
Саму статью не нашел.
Было бы неплохо, если бы Юзич включил статью в приложения своей книги.
Цитата:
…я ограничил 320*240 пикселей…
Некоторые читалки растягивают обложку на всю страницу — вы сами легко можете представить, что с ними происходит при дву-, трёхкратном увеличении. Малоэкранные же девайсы и библиотеки автоматом сожмут их до нужного размера. Озоновские каверы подойдут в случае отсутствия саморучно отсканированного изображения. Выводы делайте сами…
Вернуться к началу
Посмотреть профиль Отправить личное сообщение


Marina_Ch
Постоянный участник форума

Постоянный участник форума

Зарегистрирован: 14.04.2006
Сообщения: 779
Откуда: Москва

СообщениеДобавлено: Вт Янв 08, 2008 0:09    Заголовок сообщения: Ответить с цитатой

jurgennt, а ты попробуй книгу с большой обложкой на альд положить и полюбуйся на результат. Laughing
Я однажды видела. Доооолго веселилась. Laughing

Добавлено спустя 7 минут 19 секунд:

Mike Sinkovsky писал(а):
тогда уж ѣ -- это строчный ять.

А я код символа взяла из поста Werewolfа Laughing
Как он запостил - так я и коде и посмотрела. Laughing Лениво было лезть в уникоде смотреть Laughing
Mike Sinkovsky писал(а):
Но в стандарьных шрифтах на наладоннике его нет, будет квадрат.

А за стандартные шрифты наладонника я не отвечаю Laughing Вопрос был - как в фб2 вставить.
_________________
REB 1100, REB 1200, SE P910i
Вернуться к началу
Посмотреть профиль Отправить личное сообщение


Mike Sinkovsky
Зрелый участник форума

Зрелый участник форума

Зарегистрирован: 27.10.2005
Сообщения: 296
Откуда: Пермь

СообщениеДобавлено: Вт Янв 08, 2008 1:11    Заголовок сообщения: Ответить с цитатой

Marina_Ch писал(а):
как в фб2 вставить

Вообще насколько понимаю FBE работает в юникоде и сохраняет в utf-8, так что проблем как вставить вообще быть не должно -- запускаем Стандартные->Служебные->Таблица символов, и вставляем.
Только шрифт должен быть от висты или полный юникод, иначе отобразится квадрат.

Причем в читалке тоже, нужно установить шрифт содержащий глиф ятя. А 99% читателей это ниасилят.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение


GribUser
Автор формата FB2 - Автор библиотеки FB

Автор формата FB2 - Автор библиотеки FB

Зарегистрирован: 30.09.2004
Сообщения: 2475
Откуда: Москва

СообщениеДобавлено: Ср Янв 09, 2008 13:32    Заголовок сообщения: Ответить с цитатой

Mike Sinkovsky писал(а):
А 99% читателей это ниасилят.
Да ладно, совершенно задача тривиальная, по-моему. Уж 50% смогут ради такого случая напрячься. Нестандартные задачи по-любому без дополнительных усилий не решаются, а скопировать шрифт на наладонник дело пары минут и при наличии пошаговой инструкции под силу любой блондинке. Можно прямо в книгу инструкцию и зашить, если это так важно Smile
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail Посетить сайт автора


Alan
Автор ридера Alreader и клона Haali


Зарегистрирован: 25.01.2005
Сообщения: 421

СообщениеДобавлено: Ср Янв 09, 2008 19:32    Заголовок сообщения: Ответить с цитатой

GribUser я не знаю как на ПЦ, тут сложно сказать, но на покете ради прочтения файла меня в настройках полюбившийся шрифт на тот, который просто содержит нужный символ будет далеко не каждый... легче файл убить и начать читать что-то другое...
Вернуться к началу
Посмотреть профиль Отправить личное сообщение


Werewolf
Зрелый участник форума

Зрелый участник форума

Зарегистрирован: 12.10.2005
Сообщения: 143

СообщениеДобавлено: Чт Янв 10, 2008 5:21    Заголовок сообщения: Ответить с цитатой

У меня созрело интересное решение.

Я, наверное, попробую обойти проблему, подготовив 2 данных слова в виде графических png-файлов с прозрачным фоном. Конечно, они будут несколько выделяться по оформлению (размер, цвет и шрифт) в конкретных читалках, но я считаю это вполне допустимым, и заодно это позволяет избежать возьни с объяснением читателям, какой именно шрифт им следует настроить в своей читалке. Да и память на подгрузку юникодовского шрифта можно не тратить (сам я читаю с ПК, так что для меня такой проблемы нет, но раз в этой теме говорят, то...)

Из читалок у меня есть только cr2, cr3 и вот вчера скачал свежий Haali (2.0b264). Другие ридеры, честно говоря, в глаза не видел еще, но думаю, что вопрос не принципиален.

Обнаружилось следующее:

1. cr2 действительно не ест тег <image>, употребленный внутри тега <p> (отображает его в отдельной строке посередине). Учитывая, что я проверял читаемость fb2-файла именно в этой читалке, неудивительно что так долго провозился. cr3 и Haali такие теги съели без проблем, а выше в этой теме говорилось, что и остальные читалки тоже нормально с ними работают.
Так что, я думаю, именно поэтому стоит оформить нестандартные слова прозрачными картинками - потому что полная поддержка инлайн-картинок во всех читалках появится явно намного раньше, чем основная масса читателей привыкнет перенастраивать ридеры под конкретные книги.

2. используемый мной для редактирования fb2-документа редактор FBE 2.0 beta (свежий build Dec 25 2007) умудряется при сохранении все равно окантовать тег <image> тегами <p></p>, даже если перед этим в режиме source руками поправить все так, чтобы <image> находился просто в тексте. Так что после редактирования в нем приходилось все равно открывать fb2-документ обычным текстовым редактором и вручную убрать эти лишние теги - тогда все сразу стало отображаться в читалках нормально, естественно<p>.

В общем, теперь мне осталось поэкспериментировать с размером шрифта при подготовке png-файлов. Шрифт в Хаали довольно мелкий, а в кулридере - наоборот, довольно крупный, так что придется немного повозиться, чтобы найти золотую середину.

Как вам такое решение? Я надеюсь, оно не создаст проблем при конвертировании fb2 в файлы других форматов?

p.s. От буквиц я решил отказаться, т.к. обтекание их текстом справа все равно сделать не получится, а без этого выглядеть они будут не ахти.


Дополняю: хотя я уже отказался от оформления слов посредством графических png-файлов с прозрачным фоном, но пока пробовал этот вариант, была еще одна проблема, которую следует озвучить: более-менее сносно такие слова отображаются в читалках только в том случае, если в них отсутствуют буквы, которые при написании выходят под строку - д р у ф ц щ. В противном случае картинка-слово получается как бы "висящей" чуть повыше строки и совершенно выпадает из текста по оформлению даже при поверхностном взгляде. И обойти эту проблему невозможно.


Последний раз редактировалось: Werewolf (Сб Янв 12, 2008 4:50), всего редактировалось 2 раз(а)
Вернуться к началу
Посмотреть профиль Отправить личное сообщение


Shaman
Администратор библиотеки FictionBook.Lib

Администратор библиотеки FictionBook.Lib

Зарегистрирован: 04.10.2004
Сообщения: 781
Откуда: Россия, Санкт-Петербург

СообщениеДобавлено: Чт Янв 10, 2008 6:26    Заголовок сообщения: Ответить с цитатой

Конечно, проблемы будут. Конечно, решение далеко не самое удачное. Скорее, одно из самых неудачных, потому как в таком виде для себя можно что-то делать, а для промышленной обработки такой файл уже не годится. Промышленная обработка в данном случае подразумевает нахождение файла в либе, автоконвертацию в другие форматы, а также потенциальную конвертацию в обновленную схему.

Однако замечу сразу: я не знаю удачных решений проблемы. Байда со шрифтами - это тоже не решение.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение


Werewolf
Зрелый участник форума

Зрелый участник форума

Зарегистрирован: 12.10.2005
Сообщения: 143

СообщениеДобавлено: Чт Янв 10, 2008 7:02    Заголовок сообщения: Ответить с цитатой

Хмм... жаль.... попробовал сейчас конвертануть этот fb2-файл в rtf через fb2any, на данном месте все действительно споткнулось. Кстати говоря, а как же тогда в rtf будут конвертироваться инлайн-картинки, которые вроде бы введены в версии формата fb2.1 ?

Ну а по поводу этих слов мне, судя по всему, лучше всего будет оставить текст как есть (пара квадратов в 2 отдельных словах не делают его нечитаемым), а чтобы в читателей не возникло вопроса о неправильной подготовке книги или еще чего-нибудь такого, поставлю в этом месте дополнительную сноску со словами, например: "В данный словах используются старорусские символы, чтобы они корректно отображались, ваш ридер должен использовать для отображения текста один из шрифтов с их поддержкой - например, Lucida Sans Unicode, Cambria..."
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
Показать сообщения:   
Начать новую тему   Ответить на тему    Список форумов www.fictionbook.org -> Основы формата FB Часовой пояс: GMT + 3
На страницу 1, 2  След.
Страница 1 из 2

 
Перейти:  
Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах


Powered by phpBB © 2001, 2005 phpBB Group