Информационный портал
pocket versionPOCKET  wikiWIKI  FAQFAQ  ПоискПоиск  ПользователиПользователи  ГруппыГруппы  РегистрацияРегистрация  ПрофильПрофиль  Войти и проверить личные сообщенияВойти и проверить личные сообщения  ВходВход

Обсуждение Fb2Fix
На страницу Пред.  1, 2, 3, 4 ... 9, 10, 11  След.
 
Найти сообщения без ответов
Начать новую тему   Ответить на тему    Список форумов www.fictionbook.org -> Сделано для FB
Предыдущая тема :: Следующая тема  
Автор Сообщение


Gremlin2
Новенький участник форума

Новенький участник форума

Зарегистрирован: 06.04.2008
Сообщения: 70

СообщениеДобавлено: Пн Апр 21, 2008 12:03    Заголовок сообщения: Ответить с цитатой

Cd_spb писал(а):
Gremlin2, Выше я просил измнеять версию файла. НО! Делать это нужно только когда были существенные изменения, а не только indent.

Embarassed Я больше не буду... А, что есть "существенные изменения"?
Вернуться к началу
Посмотреть профиль Отправить личное сообщение


kis
Новенький участник форума

Новенький участник форума

Зарегистрирован: 26.03.2008
Сообщения: 19

СообщениеДобавлено: Пн Апр 21, 2008 12:11    Заголовок сообщения: Ответить с цитатой

А как насчет такого исправления?
Фраза
Код:
<p>- Так-с, так-с. А ты, видно, не такой невежда, каким кажешься. Этот вот, добавил он, взяв с полки том Шекспира, - этот вот кое в чем смыслил. <A sea change into something rich and strange>. Или хотя бы: <What potions have I drunk of Syren tears?>. </p>

Превратилась в
Код:
<p>- Так-с, так-с. А ты, видно, не такой невежда, каким кажешься. Этот вот, добавил он, взяв с полки том Шекспира, - этот вот кое в чем смыслил. <A>. Или хотя бы: &lt;What potions have I drunk of Syren tears?&gt;. </A></p>

Может лучше корявые теги в текст превращать?
Вернуться к началу
Посмотреть профиль Отправить личное сообщение


Gea
Новенький участник форума

Новенький участник форума

Зарегистрирован: 16.04.2008
Сообщения: 9

СообщениеДобавлено: Пн Апр 21, 2008 12:14    Заголовок сообщения: Ответить с цитатой

хм, сообщение не отправилось Sad
А нельзя ли добавить возможность просто проходить список каталогов и изменять/добавлять в потоке какой-нибудь параметр без остального изменения в структуре документа. Например, чтобы обновить версию или добавить автора документа или чего еще по схеме?
Вернуться к началу
Посмотреть профиль Отправить личное сообщение


kis
Новенький участник форума

Новенький участник форума

Зарегистрирован: 26.03.2008
Сообщения: 19

СообщениеДобавлено: Пн Апр 21, 2008 12:19    Заголовок сообщения: Ответить с цитатой

Да и еще, не знаю что за фигня...
кинул 3 книжки прямо в каталог где FB2Fix, и запустил
fb2fix /r- .
В итоге 2 книжки в каталоге Good оказались размером 0. Нормально запаковалась только самая маленькая (15К), а побольше (50К и 200К) - zip размером 0, если поставить опцию /с- то нормальные файлы получаются.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение


Gremlin2
Новенький участник форума

Новенький участник форума

Зарегистрирован: 06.04.2008
Сообщения: 70

СообщениеДобавлено: Пн Апр 21, 2008 16:59    Заголовок сообщения: Ответить с цитатой

Dusper писал(а):
После обработки новой версией книги с кривой кодировкой по ссылке выше в папке Good создается архив нулевого размера...

kis писал(а):
В итоге 2 книжки в каталоге Good оказались размером 0. Нормально запаковалась только самая маленькая (15К), а побольше (50К и 200К) - zip размером 0, если поставить опцию /с- то нормальные файлы получаются.


Спокойствие, только спокойствие (c) ...

OpenSource во всей своей красе, я 2 часа ломал себе глаза ища ошибку там где её нет, а ошибка похоже в SharpZipLib (тут)

Вечером, как приеду домой, буду править.

Добавлено спустя 1 минуту 55 секунд:

kis писал(а):
А как насчет такого исправления?
Фраза
Код:
<p>- Так-с, так-с. А ты, видно, не такой невежда, каким кажешься. Этот вот, добавил он, взяв с полки том Шекспира, - этот вот кое в чем смыслил. <A sea change into something rich and strange>. Или хотя бы: <What potions have I drunk of Syren tears?>. </p>

Превратилась в
Код:
<p>- Так-с, так-с. А ты, видно, не такой невежда, каким кажешься. Этот вот, добавил он, взяв с полки том Шекспира, - этот вот кое в чем смыслил. <A>. Или хотя бы: &lt;What potions have I drunk of Syren tears?&gt;. </A></p>

Может лучше корявые теги в текст превращать?


Это в новой версии?
Вернуться к началу
Посмотреть профиль Отправить личное сообщение


kis
Новенький участник форума

Новенький участник форума

Зарегистрирован: 26.03.2008
Сообщения: 19

СообщениеДобавлено: Пн Апр 21, 2008 18:11    Заголовок сообщения: Ответить с цитатой

Gremlin2 писал(а):
Это в новой версии?

И в новой и в старой тоже Very Happy
Вернуться к началу
Посмотреть профиль Отправить личное сообщение


Gea
Новенький участник форума

Новенький участник форума

Зарегистрирован: 16.04.2008
Сообщения: 9

СообщениеДобавлено: Пн Апр 21, 2008 20:37    Заголовок сообщения: Ответить с цитатой

А что-то я не пойму, в какой кодировке русские имена в лог пишутся. Одни иероглифы вместо русского.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение


Gremlin2
Новенький участник форума

Новенький участник форума

Зарегистрирован: 06.04.2008
Сообщения: 70

СообщениеДобавлено: Пн Апр 21, 2008 23:17    Заголовок сообщения: Ответить с цитатой

Gremlin2 писал(а):
OpenSource во всей своей красе, я 2 часа ломал себе глаза ища ошибку там где её нет, а ошибка похоже в SharpZipLib (тут)

Вечером, как приеду домой, буду править.

На сайте проекта забирайте исправленную версию (1.0.4)

Ошибка, как я уже говорил, в SharpZipLib, но когда она проявляется я так и не понял. На рабочем компьютере её нет, а в офисе и на ноуте 100% повторяемость. Evil or Very Mad Времени и желания искать причину нет, исправил только симптомы. Попутно нашёл и исправил у себя ошибку в обработке вложенных архивов.

Gea писал(а):
А что-то я не пойму, в какой кодировке русские имена в лог пишутся. Одни иероглифы вместо русского.

в utf-8, только без BOM в начале файла.

kis писал(а):
Превратилась в
Код:

<p>- Так-с, так-с. А ты, видно, не такой невежда, каким кажешься. Этот вот, добавил он, взяв с полки том Шекспира, - этот вот кое в чем смыслил. <A>. Или хотя бы: &lt;What potions have I drunk of Syren tears?&gt;. </A></p>

Может лучше корявые теги в текст превращать?

Можно ссылку на файл?
Вернуться к началу
Посмотреть профиль Отправить личное сообщение


GRUMM
Новенький участник форума

Новенький участник форума

Зарегистрирован: 28.03.2008
Сообщения: 39

СообщениеДобавлено: Пн Апр 21, 2008 23:44    Заголовок сообщения: Ответить с цитатой

спасибо, щас прогоним траума ещё разочек
Вернуться к началу
Посмотреть профиль Отправить личное сообщение


Cd_spb
Зрелый участник форума

Зрелый участник форума

Зарегистрирован: 28.06.2006
Сообщения: 189

СообщениеДобавлено: Вт Апр 22, 2008 10:33    Заголовок сообщения: Ответить с цитатой

Gremlin2 писал(а):
Cd_spb писал(а):
Gremlin2, Выше я просил измнеять версию файла. НО! Делать это нужно только когда были существенные изменения, а не только indent.

Embarassed Я больше не буду... А, что есть "существенные изменения"?


ИМХО:
1. Смена id.
2. Изменения тегов в body.

НЕ считаю изменениями:
1. выравнивание для просмотра в режиме кода.
2. перемена местами имя-фамилия и т.п.

Какие еще изменения производятся в документах?
Вернуться к началу
Посмотреть профиль Отправить личное сообщение


kis
Новенький участник форума

Новенький участник форума

Зарегистрирован: 26.03.2008
Сообщения: 19

СообщениеДобавлено: Вт Апр 22, 2008 10:35    Заголовок сообщения: Ответить с цитатой

Gremlin2 писал(а):
Можно ссылку на файл?

Конечно Very Happy
file:///D:/temp/fb2fix/Di_Lampeduza_Dzhuzeppe_Tomazi_Ligija.fb2
Шутка...
Вот тут он есть, кривой хмл, простор для исправлений Very Happy
http://lib.rus.ec/b/12903

Вообще для тестирования удобнее сделать заготовку fb2 книги и в боди вставлять один абзац, не нужно потом лазить по большому тексту чтоб увидеть как прошли изменения, я как раз реальный абзац и дал.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение


Gremlin2
Новенький участник форума

Новенький участник форума

Зарегистрирован: 06.04.2008
Сообщения: 70

СообщениеДобавлено: Ср Апр 23, 2008 0:07    Заголовок сообщения: Ответить с цитатой

Cd_spb писал(а):
ИМХО:
1. Смена id.
2. Изменения тегов в body.

НЕ считаю изменениями:
1. выравнивание для просмотра в режиме кода.
2. перемена местами имя-фамилия и т.п.

Какие еще изменения производятся в документах?


Много разных... Cool

Обработка документа состоит из нескольких этапов.

Сначала документ загружается в DOM при помощи SGML парсера, на этом этапе детектируется кодировка документа, производится раскрытие всех entitis (включая так-же символы представленные в виде &#code;), производится проверка всех тегов (не закрытые - закрываются, не открытые - открываются Very Happy). Так-же программа пытается определить, что является началом тега, а что ошибкой разметки документа (символы < и >). Алгоритм определения - адoптивный, т.е. собирает статистику и умеет подстраиваться под структуру документа, по этому может ошибаться. Все найденные ошибки в разметке заменяются эквивалентные символы (&lt; &gt; &amp; и т.д.). Символы из диапазона 0х01-0х08 заменяются на "-", символы 0х0b, 0х0c и 0x0e - 0x1f на " "

Далее, заголовок загруженного документа проверяется на соответствие стандарту: заменяются, исправляются и дополняются необходимые теги. Создается новый id для сами знаете кого Smile В результате должен получится полностью валидный документ. При сохранении дополнительно проверяется возможность сохранения документа в указанной в нём кодировке, если это невозможно, программа сохранит его в utf-8

И, что тут "существенные" и, что "не существенные" изменения?
Вернуться к началу
Посмотреть профиль Отправить личное сообщение


Cd_spb
Зрелый участник форума

Зрелый участник форума

Зарегистрирован: 28.06.2006
Сообщения: 189

СообщениеДобавлено: Ср Апр 23, 2008 11:16    Заголовок сообщения: Ответить с цитатой

Все кроме:
Цитата:
Символы из диапазона 0х01-0х08 заменяются на "-", символы 0х0b, 0х0c и 0x0e - 0x1f на " "

и
Цитата:
При сохранении дополнительно проверяется возможность сохранения документа в указанной в нём кодировке, если это невозможно, программа сохранит его в utf-8

являеться существенными изменениями

PS. 0x00 также не валидный.
ИМХО:
При замене непечатных символов нужно ставить версию документа 0.5
При правке боди - версию увеличивать на 0.1
При правке дескрипшина - версию увеличивать на 0.01
Вернуться к началу
Посмотреть профиль Отправить личное сообщение


kis
Новенький участник форума

Новенький участник форума

Зарегистрирован: 26.03.2008
Сообщения: 19

СообщениеДобавлено: Ср Апр 23, 2008 16:18    Заголовок сообщения: Ответить с цитатой

Gremlin2 писал(а):
Можно ссылку на файл?

Нашел еще замечательный файл - простор для тестирования Very Happy
http://lib.rus.ec/b/4061
Вернуться к началу
Посмотреть профиль Отправить личное сообщение


Gea
Новенький участник форума

Новенький участник форума

Зарегистрирован: 16.04.2008
Сообщения: 9

СообщениеДобавлено: Ср Апр 23, 2008 16:40    Заголовок сообщения: Ответить с цитатой

Не понял с /pattern: что бы ни ставил, не работает.
Форматирует все через пробел и все.

И ошибку не показывает.

Нельзя ли поподробнее про формат. Я ставил
D:\Libs>fb2fix /translify- /compress- /replacechar:" " /pattern:"*NF* *NL* --- *BN*" Primer
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
Показать сообщения:   
Начать новую тему   Ответить на тему    Список форумов www.fictionbook.org -> Сделано для FB Часовой пояс: GMT + 3
На страницу Пред.  1, 2, 3, 4 ... 9, 10, 11  След.
Страница 3 из 11

 
Перейти:  
Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах


Powered by phpBB © 2001, 2005 phpBB Group