Предыдущая тема :: Следующая тема |
Автор |
Сообщение |
Ustas Автор OCR-библиотеки Ustas SmartLib
Зарегистрирован: 16.03.2005 Сообщения: 320 Откуда: SPb
|
Добавлено: Пт Апр 15, 2005 10:16 Заголовок сообщения: Fb2 для Symbian UIQ |
|
|
На стадии тестирования парсер fb2 в программе ReadM А. Заворина.
Обещана полная поддержка формата.
Имеющие SE P*** активно тестят. |
|
Вернуться к началу |
|
|
Ustas Автор OCR-библиотеки Ustas SmartLib
Зарегистрирован: 16.03.2005 Сообщения: 320 Откуда: SPb
|
Добавлено: Пн Апр 18, 2005 9:28 Заголовок сообщения: |
|
|
Основные проблемы:
1. UTF8 из-за которого размер файла значительно возрастает (касается книг со здешней библио)
2. Большие картинки
3. Ссылки-сноски (типа кнопки "Back" нету в этой читалке ) |
|
Вернуться к началу |
|
|
Admin Администратор информационного портала FB
Зарегистрирован: 11.06.2004 Сообщения: 1610 Откуда: Воронеж
|
Добавлено: Пн Апр 18, 2005 10:15 Заголовок сообщения: |
|
|
Ustas писал(а): | Основные проблемы:
1. UTF8 из-за которого размер файла значительно возрастает (касается книг со здешней библио)
2. Большие картинки
3. Ссылки-сноски (типа кнопки "Back" нету в этой читалке ) |
Книги должны хранится в uTF8, иначе некоторые книги не читабельны, в частности, по моему, на альдебаране лежит "Война и мир" Толстого в win-1251, уж лучше бы ее вообще не делали, чем так изуродовать
2 и 3 пункт должны легко решаться в читалке и именно в читалке, уменьшение картинки, организация обратной ссылки. |
|
Вернуться к началу |
|
|
Shaman Администратор библиотеки FictionBook.Lib
Зарегистрирован: 04.10.2004 Сообщения: 781 Откуда: Россия, Санкт-Петербург
|
Добавлено: Пн Апр 18, 2005 12:00 Заголовок сообщения: |
|
|
Действительно, к сожалению, без UTF-8 иногда не обойтись. И размеры тут уже ни при чем, а при чем как раз знаки, которых нет в кодировке 1251. |
|
Вернуться к началу |
|
|
Gremlin Зрелый участник форума
Зарегистрирован: 14.02.2005 Сообщения: 155
|
Добавлено: Пн Апр 18, 2005 15:59 Заголовок сообщения: |
|
|
Shaman писал(а): | Действительно, к сожалению, без UTF-8 иногда не обойтись. И размеры тут уже ни при чем, а при чем как раз знаки, которых нет в кодировке 1251. |
UTF-8 или cp1251 тут не причем. Проблема в кривизне чьих-то руках (Возможно, что рук какого-то программера). В xml кодировка всегда unicode, независимо от кодировки файла, и текст может быть записан хоть в файле с latin-1... в виде спрошных &#CODE10; или ODE16; |
|
Вернуться к началу |
|
|
Ustas Автор OCR-библиотеки Ustas SmartLib
Зарегистрирован: 16.03.2005 Сообщения: 320 Откуда: SPb
|
Добавлено: Пн Апр 18, 2005 16:14 Заголовок сообщения: |
|
|
Shaman писал(а): | Действительно, к сожалению, без UTF-8 иногда не обойтись. И размеры тут уже ни при чем, а при чем как раз знаки, которых нет в кодировке 1251. |
Бесспорно.
В новом апдейте будет и utf8
Однако, к чему "чиста рускаму" тексту добавлять объема?
Проблема в большом файле и тормозах самой Symbian.
А насчет картинки весом, скажем 200 кило - как ее уменьшить в уже готовой книге.
Ресурсы, боюсь, не позволят.
Впрочем, надеюсь, автор поборет и эту напасть.
(опциональным отключением показа картинок, например)
ЗЫ Кнопка "Back" тоже обещана, однако, в дальней очереди... |
|
Вернуться к началу |
|
|
GribUser Автор формата FB2 - Автор библиотеки FB
Зарегистрирован: 30.09.2004 Сообщения: 2475 Откуда: Москва
|
Добавлено: Пн Апр 18, 2005 16:23 Заголовок сообщения: |
|
|
Ustas писал(а): | UTF8 из-за которого размер файла значительно возрастает (касается книг со здешней библио) |
В здешней библо русские книги хранятся в 1251. Чиста к сведению. А если люди при подготовке указывают английский, скажем, язык, то книги хранятся в utf, да. Так как вероятность прочитать на нерусифицированной системе utf8 сильно выше, чем прочитать 1251. |
|
Вернуться к началу |
|
|
Shaman Администратор библиотеки FictionBook.Lib
Зарегистрирован: 04.10.2004 Сообщения: 781 Откуда: Россия, Санкт-Петербург
|
Добавлено: Пн Апр 18, 2005 16:32 Заголовок сообщения: |
|
|
GribUser писал(а): | Ustas писал(а): | UTF8 из-за которого размер файла значительно возрастает (касается книг со здешней библио) |
В здешней библо русские книги хранятся в 1251. Чиста к сведению. А если люди при подготовке указывают английский, скажем, язык, то книги хранятся в utf, да. Так как вероятность прочитать на нерусифицированной системе utf8 сильно выше, чем прочитать 1251. |
На самом деле начиная с определенного момента (январь-февраль) почти все новые книги я выкачивал в utf-8. А поскольку читаю только по-русски, то книги были именно русские. |
|
Вернуться к началу |
|
|
GribUser Автор формата FB2 - Автор библиотеки FB
Зарегистрирован: 30.09.2004 Сообщения: 2475 Откуда: Москва
|
Добавлено: Пн Апр 18, 2005 16:36 Заголовок сообщения: |
|
|
Хм. А и верно. Че за хрень....
Добавлено спустя 17 минут 34 секунды:
Во, блин, оно все fb2 теперь гонит в utf. Причем с последнего апдейта с платностью и т.п. пирогами, все без разбору. Че ж вы молчите-то? Я-то rb читаю, я и не знал. Не сделаю, так хоть в todo добавлю... Оно, конечно, пофиг, но некузяво как-то. |
|
Вернуться к началу |
|
|
Shaman Администратор библиотеки FictionBook.Lib
Зарегистрирован: 04.10.2004 Сообщения: 781 Откуда: Россия, Санкт-Петербург
|
Добавлено: Пн Апр 18, 2005 16:57 Заголовок сообщения: |
|
|
А мне показалось, что так и задумано. Причем, если не придираться к размеру, то даже и лучше. Мало ли что там внутри, вдруг какие символы нужные... |
|
Вернуться к началу |
|
|
Ustas Автор OCR-библиотеки Ustas SmartLib
Зарегистрирован: 16.03.2005 Сообщения: 320 Откуда: SPb
|
Добавлено: Вт Апр 19, 2005 8:48 Заголовок сообщения: |
|
|
Размерчик очень даже имеет значение.
(gprs траффик и вообче)
Хотя на "Войну и мир", конечно, это правило не распространяется....
ИМХО |
|
Вернуться к началу |
|
|
Admin Администратор информационного портала FB
Зарегистрирован: 11.06.2004 Сообщения: 1610 Откуда: Воронеж
|
Добавлено: Вт Апр 19, 2005 8:57 Заголовок сообщения: |
|
|
GribUser писал(а): | Во, блин, оно все fb2 теперь гонит в utf. Причем с последнего апдейта с платностью и т.п. пирогами, все без разбору. Че ж вы молчите-то? Smile Я-то rb читаю, я и не знал. Не сделаю, так хоть в todo добавлю... Оно, конечно, пофиг, но некузяво как-то. |
Да нормально это. А ты видимо посты не всегда читаешь. Мы с Шаманом обсуждали и проверяли, что все новые книгши конвертятся в utf8. Для покета это не страшно, там памяти немеряно, да и haali, прекрасно читает архивы. А вот для symbiana imho просто надо конвертить в windows-1261, правда они могут потерять в тексте какое-нибудь фрацзуское словечко, но тут уже надо идти на компромисс. А библиотека пусть их хранит в utf8, если это не напрягает библиотеку. |
|
Вернуться к началу |
|
|
GribUser Автор формата FB2 - Автор библиотеки FB
Зарегистрирован: 30.09.2004 Сообщения: 2475 Откуда: Москва
|
Добавлено: Вт Апр 19, 2005 13:55 Заголовок сообщения: |
|
|
Admin писал(а): | правда они могут потерять в тексте какое-нибудь фрацзуское словечко | Да никуда там не денутся французске слова, не волнуйтесь. Правда война и мир в UTF может весить где-то столько же, как и в 1251, но для нормальных текстов будет нормально. Поправлю на досуге. |
|
Вернуться к началу |
|
|
Ustas Автор OCR-библиотеки Ustas SmartLib
Зарегистрирован: 16.03.2005 Сообщения: 320 Откуда: SPb
|
Добавлено: Пн Май 02, 2005 23:26 Заголовок сообщения: |
|
|
http://www.geocities.com/epocsymbia...4_22_2_beta.zip
Цитата:
What is new:
- Full Unicode support for language packs (no Unicode support for PPL parser and no UTF-16 support for FB2 parser yet, not clear if needed at all).
- FB2 parser updated to the latest 2.0 schema (xlink:href links, author-text tags, etc.)
- FB2 hangning for some files fixed (hopefully.)
Enjoy,
Alexander Zavorine
PS Вполне себе рабочая шустрая версия.... |
|
Вернуться к началу |
|
|
vvv Автор редактора BookDesigner
Зарегистрирован: 06.10.2004 Сообщения: 349
|
Добавлено: Вт Май 03, 2005 1:05 Заголовок сообщения: |
|
|
Ustas писал(а): | Размерчик очень даже имеет значение.
(gprs траффик и вообче)
|
Ustas писал(а): | http://www.geocities.com/epocsymbia...4_22_2_beta.zip
Цитата:
What is new:
- Full Unicode support for language packs (no Unicode support for PPL parser and no UTF-16 support for FB2 parser yet, not clear if needed at all).
- FB2 parser updated to the latest 2.0 schema (xlink:href links, author-text tags, etc.)
- FB2 hangning for some files fixed (hopefully.)
Enjoy,
Alexander Zavorine
PS Вполне себе рабочая шустрая версия.... |
Для зипованных файлов нет большой разницы между размером файла в utf-8 и в локальной кодировке. Процентов 10-15... Так что если заворинская читалка умеет работать с зипом - особых проблем с размером в utf не будет. |
|
Вернуться к началу |
|
|
|