Обложка, автор, название книги

Чесгря написание обработки идущих непоследовательно тегов требует сильно меньше кода, чем настучали по этому поводу букф этом топике. Ну косяк небольшой в формате, ну да. По сравнению с разбором того же rtf это просто детский лепет, а не проблема.
Не проще сделать уже workaround, занести в мемориз "напомнить им перед выпуском третей версии о косяке" и закрыть вопрос?

Понятно, в смысле, что твой моя не понимает.
Про древовидность или, если смущает мой термин, про treeview. В качестве ликбеза.
Все xml (да-да, форма, никто другое и не утверждает) - это текстовые документы. Все схемы, ее описывающие - это tree. Это к вопросу неадеквантности модели. Теперь книги. Все книги состоят из собственно книги, которая может делиться на тома, которые в свою очередь могут делится на части, которые делятся на главы, которые делятся на параграфы, которые делятся на структурные элементы типа формата. А это ничто иное, как дерево. Я не могу утверждать, что ридер должен обязательно парситься. Просто, для того, чтобы это утверждать, надо по крайней мере написать ридер, с использованием какого-либо парсера и доказать его живучесть.
Но с другой стороны обрабатывать документ, как xml, если он написан в форме xml - нет ничего более естественного. Гланды надо выдирать через горло. Что касается редакторов и библиотекарей - здесь, несомненно, надо работать только через DOM. Потому что легко, быстро и эффективно.
Что касается явы, дотнета и ООП, КОП, других новых платформ, то я встречал людей, которые считали себя крутыми программерами на том основании, что не признавали ничего, кроме, ассемблера и низкоуровнего С. Причём языками высокого уровня не пользовались принципиально, даже когда это было оправдано. Что скажешь - сами себе буратины. Надеюсь, ты не из таких. Но хочу заметить, что ява и, особенно, дотнет
обладают замечательными свойствами, которые, при их использовании позволяют создавать эффективные платформонезависимые программы. И иронии в адрес этих языков я не понимаю. Другое дело, что надо знать, где и когда какой язык и платформу применять.
Я не призываю тебя все бросать, и писать ридер через парсинг. Как тебе нравится, так и пиши. Они существуют и все мы ими пользуемся. Я, например, использую твой клон хаали. Более того, если не хочешь парсить дескрипшн, я думаю Дима поправит дескрипшн, чтобы его проще было использовать без парсинга, разумеется до той степени, чтобы не нарушить логику и удобство работы с библиотекой.
Но я не услышал, почему нельзя пропарсить дескрипшн и на этапе чтения сформировать обложку и титульный лист используя простой механизм доступа к элементам, причём вне зависимости от их местоположения в description.
Памяти много не понадобится, на быстродействие тоже особо не скажется...
Но спор, с одной стороны человека, не признающего стандартные методы работы с xml (видимо принципиально?) и желающего видеть документ в состоянии, близком к html, а с другой стороны человека, не пытавшегося написать ридер теряют смысл до тех пор, пока первый не научиться пользоваться схемой Smile

или второй не напишет ридер с парсингом.
Так шта....

Добавлено спустя 8 минут 50 секунд:

Последние два сообщения, когда писал, не видел, оказывается уже договорились.

Ну не стоит так уж на основание неточности формулировок обвинять в не компетенции. Вся моя не компетенция сводится к тому, что я не знал (теперь догадываюсь), как ты обрабатываешь документ.
Что касается рисования квадратиков, то мне нет необходимости рисовать их, я написал в свое время работающий модуль парсинга fb2 (фактически оболочку для msxml, выполняющую необходимые для fb2 дополнительные функции), который Дима Пустовит использовал в своем Библиотекаре. Именно, fb2, а не xml, в котором можно взять (get) полный элемент, например, аннотацию со всеми стилями и использовать ее для дальнейшей обработки.
Что касается лексического парсера, то они бывают разные. В свое время я писал лексические парсеры, которые обрабатывали логи для получения той или иной информации, в частности для выставления счета за электронные письма полученные из зарубежья или России (в далекие времена, когда не было еще Интернет в том виде, что сейчас, за электронные письма надо было платить, причем цена зависела от страны, откуда оно пришло). Так вот, там не было никакой рекурсии (не нужна она была): поиск подстрок, приведение к виду, удобному для обработки биллингом.
Ладно, не буду цепляться за то, что аннотация это не параграф, их может быть и несколько. Хочу просто подвести итог, что когда была сброшена спесь Smile

, выяснилось, что обработку документа мы понимаем одинаково. Разница лишь в том, что я работаю не в таких тесных условиях и использую для парсинга DOM и собственную оболочку, а тебе экономя время и место (что естесственно для мобильных устройств) приходится писать свой, но основанный на той же обработки дерева, и суть спора сразу улетучилась . Very Happy

Кстати, правка в DOM решается очень просто, на основе XPoint/XPath Very Happy

И вот же не лень им бодаться... Twisted Evil