Предыдущая тема :: Следующая тема |
Автор |
Сообщение |
Gremlin2 Новенький участник форума
Зарегистрирован: 06.04.2008 Сообщения: 70
|
Добавлено: Пн Апр 21, 2008 12:03 Заголовок сообщения: |
|
|
Cd_spb писал(а): | Gremlin2, Выше я просил измнеять версию файла. НО! Делать это нужно только когда были существенные изменения, а не только indent. |
Я больше не буду... А, что есть "существенные изменения"? |
|
Вернуться к началу |
|
|
kis Новенький участник форума
Зарегистрирован: 26.03.2008 Сообщения: 19
|
Добавлено: Пн Апр 21, 2008 12:11 Заголовок сообщения: |
|
|
А как насчет такого исправления?
Фраза
Код: | <p>- Так-с, так-с. А ты, видно, не такой невежда, каким кажешься. Этот вот, добавил он, взяв с полки том Шекспира, - этот вот кое в чем смыслил. <A sea change into something rich and strange>. Или хотя бы: <What potions have I drunk of Syren tears?>. </p> |
Превратилась в
Код: | <p>- Так-с, так-с. А ты, видно, не такой невежда, каким кажешься. Этот вот, добавил он, взяв с полки том Шекспира, - этот вот кое в чем смыслил. <A>. Или хотя бы: <What potions have I drunk of Syren tears?>. </A></p>
|
Может лучше корявые теги в текст превращать? |
|
Вернуться к началу |
|
|
Gea Новенький участник форума
Зарегистрирован: 16.04.2008 Сообщения: 9
|
Добавлено: Пн Апр 21, 2008 12:14 Заголовок сообщения: |
|
|
хм, сообщение не отправилось
А нельзя ли добавить возможность просто проходить список каталогов и изменять/добавлять в потоке какой-нибудь параметр без остального изменения в структуре документа. Например, чтобы обновить версию или добавить автора документа или чего еще по схеме? |
|
Вернуться к началу |
|
|
kis Новенький участник форума
Зарегистрирован: 26.03.2008 Сообщения: 19
|
Добавлено: Пн Апр 21, 2008 12:19 Заголовок сообщения: |
|
|
Да и еще, не знаю что за фигня...
кинул 3 книжки прямо в каталог где FB2Fix, и запустил
fb2fix /r- .
В итоге 2 книжки в каталоге Good оказались размером 0. Нормально запаковалась только самая маленькая (15К), а побольше (50К и 200К) - zip размером 0, если поставить опцию /с- то нормальные файлы получаются. |
|
Вернуться к началу |
|
|
Gremlin2 Новенький участник форума
Зарегистрирован: 06.04.2008 Сообщения: 70
|
Добавлено: Пн Апр 21, 2008 16:59 Заголовок сообщения: |
|
|
Dusper писал(а): | После обработки новой версией книги с кривой кодировкой по ссылке выше в папке Good создается архив нулевого размера...
|
kis писал(а): | В итоге 2 книжки в каталоге Good оказались размером 0. Нормально запаковалась только самая маленькая (15К), а побольше (50К и 200К) - zip размером 0, если поставить опцию /с- то нормальные файлы получаются. |
Спокойствие, только спокойствие (c) ...
OpenSource во всей своей красе, я 2 часа ломал себе глаза ища ошибку там где её нет, а ошибка похоже в SharpZipLib (тут)
Вечером, как приеду домой, буду править.
Добавлено спустя 1 минуту 55 секунд:
kis писал(а): | А как насчет такого исправления?
Фраза
Код: | <p>- Так-с, так-с. А ты, видно, не такой невежда, каким кажешься. Этот вот, добавил он, взяв с полки том Шекспира, - этот вот кое в чем смыслил. <A sea change into something rich and strange>. Или хотя бы: <What potions have I drunk of Syren tears?>. </p> |
Превратилась в
Код: | <p>- Так-с, так-с. А ты, видно, не такой невежда, каким кажешься. Этот вот, добавил он, взяв с полки том Шекспира, - этот вот кое в чем смыслил. <A>. Или хотя бы: <What potions have I drunk of Syren tears?>. </A></p>
|
Может лучше корявые теги в текст превращать? |
Это в новой версии? |
|
Вернуться к началу |
|
|
kis Новенький участник форума
Зарегистрирован: 26.03.2008 Сообщения: 19
|
Добавлено: Пн Апр 21, 2008 18:11 Заголовок сообщения: |
|
|
Gremlin2 писал(а): | Это в новой версии? |
И в новой и в старой тоже |
|
Вернуться к началу |
|
|
Gea Новенький участник форума
Зарегистрирован: 16.04.2008 Сообщения: 9
|
Добавлено: Пн Апр 21, 2008 20:37 Заголовок сообщения: |
|
|
А что-то я не пойму, в какой кодировке русские имена в лог пишутся. Одни иероглифы вместо русского. |
|
Вернуться к началу |
|
|
Gremlin2 Новенький участник форума
Зарегистрирован: 06.04.2008 Сообщения: 70
|
Добавлено: Пн Апр 21, 2008 23:17 Заголовок сообщения: |
|
|
Gremlin2 писал(а): | OpenSource во всей своей красе, я 2 часа ломал себе глаза ища ошибку там где её нет, а ошибка похоже в SharpZipLib (тут)
Вечером, как приеду домой, буду править. |
На сайте проекта забирайте исправленную версию (1.0.4)
Ошибка, как я уже говорил, в SharpZipLib, но когда она проявляется я так и не понял. На рабочем компьютере её нет, а в офисе и на ноуте 100% повторяемость. Времени и желания искать причину нет, исправил только симптомы. Попутно нашёл и исправил у себя ошибку в обработке вложенных архивов.
Gea писал(а): | А что-то я не пойму, в какой кодировке русские имена в лог пишутся. Одни иероглифы вместо русского. |
в utf-8, только без BOM в начале файла.
kis писал(а): | Превратилась в
Код: |
<p>- Так-с, так-с. А ты, видно, не такой невежда, каким кажешься. Этот вот, добавил он, взяв с полки том Шекспира, - этот вот кое в чем смыслил. <A>. Или хотя бы: <What potions have I drunk of Syren tears?>. </A></p>
| Может лучше корявые теги в текст превращать? |
Можно ссылку на файл? |
|
Вернуться к началу |
|
|
GRUMM Новенький участник форума
Зарегистрирован: 28.03.2008 Сообщения: 39
|
Добавлено: Пн Апр 21, 2008 23:44 Заголовок сообщения: |
|
|
спасибо, щас прогоним траума ещё разочек |
|
Вернуться к началу |
|
|
Cd_spb Зрелый участник форума
Зарегистрирован: 28.06.2006 Сообщения: 189
|
Добавлено: Вт Апр 22, 2008 10:33 Заголовок сообщения: |
|
|
Gremlin2 писал(а): | Cd_spb писал(а): | Gremlin2, Выше я просил измнеять версию файла. НО! Делать это нужно только когда были существенные изменения, а не только indent. |
Я больше не буду... А, что есть "существенные изменения"? |
ИМХО:
1. Смена id.
2. Изменения тегов в body.
НЕ считаю изменениями:
1. выравнивание для просмотра в режиме кода.
2. перемена местами имя-фамилия и т.п.
Какие еще изменения производятся в документах? |
|
Вернуться к началу |
|
|
kis Новенький участник форума
Зарегистрирован: 26.03.2008 Сообщения: 19
|
Добавлено: Вт Апр 22, 2008 10:35 Заголовок сообщения: |
|
|
Gremlin2 писал(а): | Можно ссылку на файл? |
Конечно
file:///D:/temp/fb2fix/Di_Lampeduza_Dzhuzeppe_Tomazi_Ligija.fb2
Шутка...
Вот тут он есть, кривой хмл, простор для исправлений
http://lib.rus.ec/b/12903
Вообще для тестирования удобнее сделать заготовку fb2 книги и в боди вставлять один абзац, не нужно потом лазить по большому тексту чтоб увидеть как прошли изменения, я как раз реальный абзац и дал. |
|
Вернуться к началу |
|
|
Gremlin2 Новенький участник форума
Зарегистрирован: 06.04.2008 Сообщения: 70
|
Добавлено: Ср Апр 23, 2008 0:07 Заголовок сообщения: |
|
|
Cd_spb писал(а): | ИМХО:
1. Смена id.
2. Изменения тегов в body.
НЕ считаю изменениями:
1. выравнивание для просмотра в режиме кода.
2. перемена местами имя-фамилия и т.п.
Какие еще изменения производятся в документах? |
Много разных...
Обработка документа состоит из нескольких этапов.
Сначала документ загружается в DOM при помощи SGML парсера, на этом этапе детектируется кодировка документа, производится раскрытие всех entitis (включая так-же символы представленные в виде &#code;), производится проверка всех тегов (не закрытые - закрываются, не открытые - открываются ). Так-же программа пытается определить, что является началом тега, а что ошибкой разметки документа (символы < и >). Алгоритм определения - адoптивный, т.е. собирает статистику и умеет подстраиваться под структуру документа, по этому может ошибаться. Все найденные ошибки в разметке заменяются эквивалентные символы (< > & и т.д.). Символы из диапазона 0х01-0х08 заменяются на "-", символы 0х0b, 0х0c и 0x0e - 0x1f на " "
Далее, заголовок загруженного документа проверяется на соответствие стандарту: заменяются, исправляются и дополняются необходимые теги. Создается новый id для сами знаете кого В результате должен получится полностью валидный документ. При сохранении дополнительно проверяется возможность сохранения документа в указанной в нём кодировке, если это невозможно, программа сохранит его в utf-8
И, что тут "существенные" и, что "не существенные" изменения? |
|
Вернуться к началу |
|
|
Cd_spb Зрелый участник форума
Зарегистрирован: 28.06.2006 Сообщения: 189
|
Добавлено: Ср Апр 23, 2008 11:16 Заголовок сообщения: |
|
|
Все кроме:
Цитата: | Символы из диапазона 0х01-0х08 заменяются на "-", символы 0х0b, 0х0c и 0x0e - 0x1f на " " |
и
Цитата: | При сохранении дополнительно проверяется возможность сохранения документа в указанной в нём кодировке, если это невозможно, программа сохранит его в utf-8 |
являеться существенными изменениями
PS. 0x00 также не валидный.
ИМХО:
При замене непечатных символов нужно ставить версию документа 0.5
При правке боди - версию увеличивать на 0.1
При правке дескрипшина - версию увеличивать на 0.01 |
|
Вернуться к началу |
|
|
kis Новенький участник форума
Зарегистрирован: 26.03.2008 Сообщения: 19
|
Добавлено: Ср Апр 23, 2008 16:18 Заголовок сообщения: |
|
|
Gremlin2 писал(а): | Можно ссылку на файл? |
Нашел еще замечательный файл - простор для тестирования
http://lib.rus.ec/b/4061 |
|
Вернуться к началу |
|
|
Gea Новенький участник форума
Зарегистрирован: 16.04.2008 Сообщения: 9
|
Добавлено: Ср Апр 23, 2008 16:40 Заголовок сообщения: |
|
|
Не понял с /pattern: что бы ни ставил, не работает.
Форматирует все через пробел и все.
И ошибку не показывает.
Нельзя ли поподробнее про формат. Я ставил
D:\Libs>fb2fix /translify- /compress- /replacechar:" " /pattern:"*NF* *NL* --- *BN*" Primer |
|
Вернуться к началу |
|
|
|
|
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете голосовать в опросах
|
Powered by phpBB © 2001, 2005 phpBB Group
|