Информационный портал
pocket versionPOCKET  wikiWIKI  FAQFAQ  ПоискПоиск  ПользователиПользователи  ГруппыГруппы  РегистрацияРегистрация  ПрофильПрофиль  Войти и проверить личные сообщенияВойти и проверить личные сообщения  ВходВход

Вопрос по Any2FB - проблемы с charset - где обсуждать?

 
Найти сообщения без ответов
Начать новую тему   Ответить на тему    Список форумов www.fictionbook.org -> Сделано для FB
Предыдущая тема :: Следующая тема  
Автор Сообщение


Tester
Гость





СообщениеДобавлено: Пт Ноя 19, 2004 23:24    Заголовок сообщения: Вопрос по Any2FB - проблемы с charset - где обсуждать? Ответить с цитатой

Здравствуйте,
если вопрос оффтопик - подскажите где его надо писать.

Проблема: Any2FB при конвертации html-текста (СамИздат, Win1251) в FB2 записывает русские буквы как &#xxx; - в результате Haali Reader полученный FB2 отображает латиницей.
Попытка сменить format-encoding в настройках самого Haali Reader приводит к ошибке XML, (кстати в чем различие между encoding и default encoding?), попытка поиграть галочкой "Do not convert charset" в Any2FB-GUI ничего не меняет.
BookDesigner на попытку загрузки исходного html-файла просто заявляет "ошибка конверсии", а с FB2 я не могу добиться показа русского текста.

Собственно вопрос: как отучить Any2FB преобразовывать русские буквы в html-коды?
Где находится оригинал (последняя версия) утилит конверсии? Какая именно версия последняя?
И нельзя ли путем редактирования XML или format-encoding в настройках самого Haali Reader добиться, чтобы он показывал русский текст, несмотря на запись букв в виде &#xxx; - ведь конвертацию в символы он выполняет?

На большом компе в подобных случаях я просто меняю фонт на старый, игнорирующий Unicode-charsets (ERfont, ArialCyr) и все видно. На КПК такого фонта у меня нет.

Можно, конечно, написать самому конвертер, меняющий все коды &#xxx; на отдельные буквы. Можно попытаться сконвертировать через простой текст. Можно вообще написать свой конвертер html-FB2. Но может быть кто-то уже нашел более простое готовое решение?
Вернуться к началу


Гость






СообщениеДобавлено: Пт Ноя 19, 2004 23:39    Заголовок сообщения: Re: Вопрос по Any2FB - проблемы с charset - где обсуждать? Ответить с цитатой

Tester писал(а):
BookDesigner на попытку загрузки исходного html-файла просто заявляет "ошибка конверсии", а с FB2 я не могу добиться показа русского текста.

Ссылку на исходный html-файл дать можете?
Вернуться к началу


GribUser
Автор формата FB2 - Автор библиотеки FB

Автор формата FB2 - Автор библиотеки FB

Зарегистрирован: 30.09.2004
Сообщения: 2475
Откуда: Москва

СообщениеДобавлено: Сб Ноя 20, 2004 15:50    Заголовок сообщения: Re: Вопрос по Any2FB - проблемы с charset - где обсуждать? Ответить с цитатой

Tester писал(а):
Здравствуйте,
если вопрос оффтопик - подскажите где его надо писать.

Проблема: Any2FB при конвертации html-текста (СамИздат, Win1251) в FB2 записывает русские буквы как &#xxx; - в результате Haali Reader полученный FB2 отображает латиницей.
У вас система нерусская. Либо поставьте язык по-умолчанию русский в системе, либо отыщите в экзешнике Any2FB строку windows-1251 и замените на 1252. Потом прийдется руками в xml менять 1252 на 1251. Но проще всего систему настроить на работу с русским.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail Посетить сайт автора


Гость






СообщениеДобавлено: Сб Ноя 20, 2004 23:11    Заголовок сообщения: ОК - теперь почти все в порядке. Ответить с цитатой

Anonymous писал(а):
Tester писал(а):
BookDesigner на попытку загрузки исходного html-файла просто заявляет "ошибка конверсии"
Ссылку на исходный html-файл дать можете?
СамИздат Мошкова, Топ40 - Панкеева, часть5. После чтения доки Wink предположил, что проблема в отсутствии Word2000, но, поигравшись с настройками, выяснил, что галочка "re-format completely" проблему все же решает. И даже русский текст виден теперь нормально! Спасибо!

Только вот времени это отняло много... Часа 4 ковырялся. Я наверно все же напишу себе простейший конвертор на чем-нибудь вроде Perl. Мне ведь лично оформление безразлично и оглавление не нужно. Я при преобразовании html в rb для RocketEbook (старая Ракета принимала html и сама делала rb) просто менял вручную заменой <dd> на <p> и стирал все остальные теги кроме html/body - и мне такого форматирования хватало. А в текстовых файлах я опять вручную приписывал html/body, менял абзацный отступ на <p>, а "<p>_пробелы_" на <p align=center>, и все ОК - с моей точки зрения. Я вообще заморочился с форматом FB2 только из-за HaaliReader-а на моем КПК.
Вернуться к началу


Тестер
Гость





СообщениеДобавлено: Сб Ноя 20, 2004 23:19    Заголовок сообщения: ОК Ответить с цитатой

GribUser писал(а):
У вас система нерусская. Либо поставьте язык по-умолчанию русский в системе, либо отыщите в экзешнике Any2FB строку windows-1251 и замените на 1252. Потом прийдется руками в xml менять 1252 на 1251. Но проще всего систему настроить на работу с русским.
Не проще. Sad У меня не ХР, а 98 и 2000. И мне в основном немецкий нужен, умляуты всякие. Я уже обошелся BookDesigner-ом, но спасибо за ответ, буду иметь его в виду при необходимости. В свободное время сравню результаты. Smile
Вернуться к началу


vvv
Автор редактора BookDesigner

Автор редактора BookDesigner

Зарегистрирован: 06.10.2004
Сообщения: 349

СообщениеДобавлено: Вс Ноя 21, 2004 0:44    Заголовок сообщения: Re: ОК - теперь почти все в порядке. Ответить с цитатой

Anonymous писал(а):
Anonymous писал(а):
Tester писал(а):
BookDesigner на попытку загрузки исходного html-файла просто заявляет "ошибка конверсии"
Ссылку на исходный html-файл дать можете?
СамИздат Мошкова, Топ40 - Панкеева, часть5. После чтения доки Wink предположил, что проблема в отсутствии Word2000, но, поигравшись с настройками, выяснил, что галочка "re-format completely" проблему все же решает. И даже русский текст виден теперь нормально! Спасибо!

Только вот времени это отняло много... Часа 4 ковырялся. Я наверно все же напишу себе простейший конвертор на чем-нибудь вроде Perl. Мне ведь лично оформление безразлично и оглавление не нужно. Я при преобразовании html в rb для RocketEbook (старая Ракета принимала html и сама делала rb) просто менял вручную заменой <dd> на <p> и стирал все остальные теги кроме html/body - и мне такого форматирования хватало. А в текстовых файлах я опять вручную приписывал html/body, менял абзацный отступ на <p>, а "<p>_пробелы_" на <p align=center>, и все ОК - с моей точки зрения. Я вообще заморочился с форматом FB2 только из-за HaaliReader-а на моем КПК.

Ох уж мне эти <dd>, столько крови попортили... Мерзостный тэг и дефинирован через зад... Вообще-то он предназначен для словарей, но иногда народ его пользует ну совсем не по делу...
Видимо, в нем проблема, я в BD его глубоко не отрабатываю, на полный анализ в режиме "keep original format" требуется много времени. А в "re-format completely" все тэги выбрасываются, поэтому и работает.

За ссылку спасибо: еще одна книга в моей коллекции под названием "нестандартное форматирование" будет полезна для усовершенствования BD. Когда разберусь, в чем была проблема - сообщу.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение


vvv
Автор редактора BookDesigner

Автор редактора BookDesigner

Зарегистрирован: 06.10.2004
Сообщения: 349

СообщениеДобавлено: Вс Ноя 21, 2004 0:55    Заголовок сообщения: Re: ОК - теперь почти все в порядке. Ответить с цитатой

Anonymous писал(а):
Anonymous писал(а):
Tester писал(а):
BookDesigner на попытку загрузки исходного html-файла просто заявляет "ошибка конверсии"
Ссылку на исходный html-файл дать можете?
СамИздат Мошкова, Топ40 - Панкеева, часть5. После чтения доки Wink предположил, что проблема в отсутствии Word2000, но, поигравшись с настройками, выяснил, что галочка "re-format completely" проблему все же решает. И даже русский текст виден теперь нормально! Спасибо!

Только вот времени это отняло много... Часа 4 ковырялся. Я наверно все же напишу себе простейший конвертор на чем-нибудь вроде Perl. Мне ведь лично оформление безразлично и оглавление не нужно. Я при преобразовании html в rb для RocketEbook (старая Ракета принимала html и сама делала rb) просто менял вручную заменой <dd> на <p> и стирал все остальные теги кроме html/body - и мне такого форматирования хватало. А в текстовых файлах я опять вручную приписывал html/body, менял абзацный отступ на <p>, а "<p>_пробелы_" на <p align=center>, и все ОК - с моей точки зрения. Я вообще заморочился с форматом FB2 только из-за HaaliReader-а на моем КПК.

Посмотрел файл. Оказалось, что для такого типа форматирования я уже скорректировал работу с <dd> в режиме "keep original format". Но в последний апдейт это, по-видимому, не вошло. Вскоре сделаю новый апдейт, с ним все будет работать.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
Показать сообщения:   
Начать новую тему   Ответить на тему    Список форумов www.fictionbook.org -> Сделано для FB Часовой пояс: GMT + 3
Страница 1 из 1

 
Перейти:  
Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах


Powered by phpBB © 2001, 2005 phpBB Group