Информационный портал
pocket versionPOCKET  wikiWIKI  FAQFAQ  ПоискПоиск  ПользователиПользователи  ГруппыГруппы  РегистрацияРегистрация  ПрофильПрофиль  Войти и проверить личные сообщенияВойти и проверить личные сообщения  ВходВход

JEFLibrarian (ex. JFBLibrary)
На страницу Пред.  1, 2, 3, 4, 5, 6 ... 12, 13, 14  След.
 
Найти сообщения без ответов
Начать новую тему   Ответить на тему    Список форумов www.fictionbook.org -> Сделано для FB
Предыдущая тема :: Следующая тема  
Автор Сообщение


Mar00k
Новенький участник форума

Новенький участник форума

Зарегистрирован: 16.11.2007
Сообщения: 32
Откуда: Минск

СообщениеДобавлено: Пт Апр 11, 2008 6:38    Заголовок сообщения: Ответить с цитатой

По поводу языка (точнее отсутствия возможностбрать всё) - по-моему принципиально неверно.

Скажем тот же Толкиен - я хотел бы видеть все его книги вместе, т.к. автор 1. А то что часть этих книг на английском - так то дело десятое.
Да и в целом странная на мой взгляд идея запрета просмотра всех языков сразу.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение


Cd_spb
Зрелый участник форума

Зрелый участник форума

Зарегистрирован: 28.06.2006
Сообщения: 189

СообщениеДобавлено: Пт Апр 11, 2008 12:35    Заголовок сообщения: Ответить с цитатой

hedgehog77 писал(а):

Mar00k писал(а):

1. При показе книг по авторам при выборе языка "пусто" показывает всех авторов, независимо от языка. Всё бы хорошо, но рядом например находятся Чак Паланик и Чак Паланик. По одним книгам язык русский, по другим - английский. И в синонимы тоже не добавить.

Неправильного Паланика (его просто отследить выбрав английский язык) надо просто отредактировать -- сменить язык, тогда при совпадении имен система объединит авторов и проапдейтит язык у книг. Все манипуляции будут на уровне БД -- обновление исходников самих документов не произойдёт (этот функционал будет позже).

Хотелось бы сразу добавить в ToDo - при каких либо изменениях в документе, менять версию документа, хотя бы на одну сотую и редактировать авторов документа. В противном случае очень сложно разбираться какая версия новее, если документы поступают из разных источников.

Добавлено спустя 22 секунды:

Mar00k, для правильного, валидного fb2 у Вас будут, соответственно - русское прочтение имени Автора для ru, а оригинальное для всех остальных.
И каким образом у Вас будут все книги у одного "автора"?
Вернуться к началу
Посмотреть профиль Отправить личное сообщение


Mar00k
Новенький участник форума

Новенький участник форума

Зарегистрирован: 16.11.2007
Сообщения: 32
Откуда: Минск

СообщениеДобавлено: Пт Апр 11, 2008 12:59    Заголовок сообщения: Ответить с цитатой

Cd_spb, Вы может быть не в курсе, но помимо русского и английского есть масса иных языков. В том числе славянских. И часть из них по написанию (особенно ФИО) очень близки к русскому. Хотя бы белорусский и украинский.

И плюс к этому давайте ближе к реальности - есть масса полувалидных документов с того же lib.rus.ec И вот оттуда есть Чак Паланик на английском языке (хотя автор написан по-русски) и прочие моменты.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение


Cd_spb
Зрелый участник форума

Зрелый участник форума

Зарегистрирован: 28.06.2006
Сообщения: 189

СообщениеДобавлено: Пт Апр 11, 2008 15:49    Заголовок сообщения: Ответить с цитатой

Mar00k, по первой части - как-то я об этом не подумал... :-\
По второй - с полувалидными документами нужно бороться. И если они будут бросаться в глаза, то тем лучше - быстрее возникнет желание исправить книгу. Я сейчас это делаю ДО добавления в базу. Но ест-но это все ИМХО, и каждый решает для себя.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение


Mar00k
Новенький участник форума

Новенький участник форума

Зарегистрирован: 16.11.2007
Сообщения: 32
Откуда: Минск

СообщениеДобавлено: Пт Апр 11, 2008 16:38    Заголовок сообщения: Ответить с цитатой

А если поправили часть книг, может быть поправленные книги на либрусек зальёте? =)

Всем проще будет. А то на сегодняшний день например почти вся Агата Кристи с либрусека невалидна =(

Кстати как вариант пожелания: при импорте книг в JEFLibrarian сделать опцию (причём по умолчанию включённую) не импортировать невалидные книги.
И проверять валидность. В результате будет сразу видно что не работает из-за кривых книг, а что из-за реально ошибок программы.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение


Cd_spb
Зрелый участник форума

Зрелый участник форума

Зарегистрирован: 28.06.2006
Сообщения: 189

СообщениеДобавлено: Пт Апр 11, 2008 17:45    Заголовок сообщения: Ответить с цитатой

Вам какие из нескольких тысяч? Smile
[off]Через некоторое время я хочу отдать всю свою библиотеку. наверно через p2p.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение


mkb512
Новенький участник форума

Новенький участник форума

Зарегистрирован: 21.08.2007
Сообщения: 14

СообщениеДобавлено: Сб Апр 12, 2008 18:51    Заголовок сообщения: Ответить с цитатой

А вот эта дает Out of Memory: Java heap space

http://lib.aldebaran.ru/author/korda_maikl/korda_maikl_bessmertnye/
Вернуться к началу
Посмотреть профиль Отправить личное сообщение


Mar00k
Новенький участник форума

Новенький участник форума

Зарегистрирован: 16.11.2007
Сообщения: 32
Откуда: Минск

СообщениеДобавлено: Сб Апр 12, 2008 19:35    Заголовок сообщения: Ответить с цитатой

Есть ещё несколько книг которые дают ту же ошибку. Судя по всему дело в размере книги - если больше 3 мб, то не импортируются.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение


mkb512
Новенький участник форума

Новенький участник форума

Зарегистрирован: 21.08.2007
Сообщения: 14

СообщениеДобавлено: Сб Апр 12, 2008 19:58    Заголовок сообщения: Ответить с цитатой

Нет. Фоменко побольше в два раза, закачался нормально.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение


hedgehog77
Зрелый участник форума

Зрелый участник форума

Зарегистрирован: 19.07.2007
Сообщения: 122
Откуда: Минск

СообщениеДобавлено: Вс Апр 13, 2008 0:13    Заголовок сообщения: Ответить с цитатой

Mar00k писал(а):
Скажем тот же Толкиен - я хотел бы видеть все его книги вместе, т.к. автор 1. А то что часть этих книг на английском - так то дело десятое.

А под каким именем видеть? Джон Р.Р. Толкин? John R.R. Tolkien? Или может J・R・R・トールキン?

Mar00k писал(а):
Да и в целом странная на мой взгляд идея запрета просмотра всех языков сразу.

Идея не в запрете, а в разбиении (partitioning) информации и предоставлении удобной навигации.

Чтобы предупредить возможные вопросы, расскажу как планируется система мультиязычности по авторам:
1. Авторы на различных языках будут вязаться между собой (для начала вручную, а впоследствии после написания серверной системы -- автоматом из репозитория авторов). Но эти связи - не синонимы. Синонимы -- это варианты написания автора на конкурентном языке.
2. При выборе автора на закладке авторов, под списком авторов будет виджет с инфой по выбранному автору: оригинальное имя, возможно, фотография и (внимание!) ссылки на этого же автора на других языках (с кол-вом книг для каждого языка).

Добавлено спустя 10 минут 35 секунд:

Mar00k писал(а):
Есть ещё несколько книг которые дают ту же ошибку. Судя по всему дело в размере книги - если больше 3 мб, то не импортируются.

Есть такая проблема -- дело в xml-парсере. Думаю перейти с dom4j (используется сейчас) на vtd -- по идее должно помочь, но потребует времени на переписывание и отладку (и поэтому будет позже).

Добавлено спустя 2 минуты 52 секунды:

mkb512 писал(а):
Нет. Фоменко побольше в два раза, закачался нормально.


Дело не столько в "сыром" размере документа, а сколько в его сложности: кол-во узлов, ссылок и прочее. А если 2Мб из 3Мб занимает обложка (в зверском разрешении), то парсер съест такой документ без вопросов.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение


mkb512
Новенький участник форума

Новенький участник форума

Зарегистрирован: 21.08.2007
Сообщения: 14

СообщениеДобавлено: Вс Апр 13, 2008 10:48    Заголовок сообщения: Ответить с цитатой

Может быть.
Указаная мною книга, после перевода из UTF-8 в Win-1251 с помощью FB2Fix импортировалась нормально. Причем изначально в книге указана кодировка Win-1252. Есть конечно шанс, что FB2Fix выкинул все ссылки и уменьшил количество узлов, я не проверял, но маловерятно. По крайней мере в библиотеке книга выглядит как живая.

Вот эти три книги не прошли с такой же диагностикой.
http://lib.aldebaran.ru/author/lopatin_vladimir/lopatin_vladimir_russkii_orfograficheskii_slovar/
http://lib.aldebaran.ru/author/lopatin_vladimir/lopatin_vladimir_russkii_orfograficheskii_slovar_an/
http://lib.aldebaran.ru/author/lopatin_vladimir/lopatin_vladimir_russkii_orfograficheskii_slovar_oya/

И во всех указана кодировка Win-1251 и постоянно встречаются строки типа
Код:

<p><strong>обалдева́ть</strong>, -а́ю, -а́ет</p>


Блин, не знаю как вставить. В общем где в примере ударения в тексте &#769. И так по всей книге. А у Корды весь текст при указанной Win-1252 выглядит как ;&#1072. Может конечно никак и не свзязано, но информация к размышлению.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение


hedgehog77
Зрелый участник форума

Зрелый участник форума

Зарегистрирован: 19.07.2007
Сообщения: 122
Откуда: Минск

СообщениеДобавлено: Пн Апр 14, 2008 3:17    Заголовок сообщения: Ответить с цитатой

Новая версия:

http://www.mediafire.com/?wmm1enze9jk - linux
http://www.mediafire.com/?ocmymng5lcs - win32
http://www.mediafire.com/?wtdpcoewsmg - update

- В детализации книги теперь авторы, серии и жанры -- кликабельные ссылки.
- Исправлен баг с переключением языков (снова можно увидеть жанры по-русски), уменьшено кол-во языков в настройках (до двух реально поддерживаемых на данный момент)
- Реализована возможость добавления новых серий при редактировании книги
- Прочая мелочь

Добавлено спустя 9 минут 33 секунды:

mkb512 писал(а):
И во всех указана кодировка Win-1251 и постоянно встречаются строки типа
Код:

<p><strong>обалдева́ть</strong>, -а́ю, -а́ет</p>


Блин, не знаю как вставить. В общем где в примере ударения в тексте &#769. И так по всей книге. А у Корды весь текст при указанной Win-1252 выглядит как ;&#1072. Может конечно никак и не свзязано, но информация к размышлению.

Суть я понял. Это все из-за попытки запихнуть в однобайтную кодировку символы не попадающие в диапазон этой кодировки -- вот они-то и заменяются на коды. Соотвественно если текст с кириллицей сконверить в win1252 (в которой кириллицы нет), то все русские символы заменятся на представление в виде кода. DOM-парсер, загружая всю эту радость, каждый символ представляет в виде отдельного объекта xml entity в памяти, с неизбежными печальными последствиями в виде напрочь съеденной heap-памяти Sad
Вернуться к началу
Посмотреть профиль Отправить личное сообщение


Cherckes
Новенький участник форума

Новенький участник форума

Зарегистрирован: 05.05.2007
Сообщения: 89
Откуда: Гомель

СообщениеДобавлено: Пн Апр 14, 2008 6:59    Заголовок сообщения: Ответить с цитатой

При добавлении книг дубликатов - добавляет одну, но в авторы - книги считает две, три .... и так все имеющиеся дубли. Хотя общее количество соответствует добавленому.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Yahoo Messenger


kis
Новенький участник форума

Новенький участник форума

Зарегистрирован: 26.03.2008
Сообщения: 19

СообщениеДобавлено: Пн Апр 14, 2008 13:43    Заголовок сообщения: Ответить с цитатой

hedgehog77 писал(а):
Новая версия:

Поиздевался над программой на предмет багов, хочется мне чтоб цифирки сходились Very Happy
и чтоб трудновыявляемый мусор в хранилище не скапливался.
У меня
JEFLib 2008-04-14
WinXP SP2
Java 1.6.0_02
internal storage
(ПЧ - правая часть окна, а ЛЧ - левая)
1. Удалил авторов вместе с книжками, но
- в на закладке жанры прога показывает что книги якобы есть
(количество) а в списке книг (в правой части) ничего нет
- и файлы в хранилище остались (так и должно быть?)

2. Странности с жанрами Cool
В базе одна книга. Закрываю программу стоя на любой закладке (кроме жанров). Запускаю программу, сразу переключаюсь на закладку Авторы, переключаюсь на закладку жанры: в ЛЧ все нормально, в жанре есть одна книга, тыкаю в жанр - в списке книг (ПЧ) пусто.
Когда программа сразу открывается на Авторах то в жанрах (в списке книг) я книгу уже не вижу.
Если после открытия на мы на других закладках и переходим в жанры, то книгу видно.
Эффект пропадает если в БД есть книга из серии!!!

3. Добавляю ту же книгу еще раз (у нее "плохой" ID - либрусек) результат:
- закладка Авторы - ЛЧ: Автор 1, книг 2; ПЧ: одна книга;
- Закладка Жанры - ЛЧ: жанр 1, книга 1; ПЧ: одна книга;
- Поиск выдает 2 книги с одним ID, последним добавленным в БД;
- в хранилище 2 файла с книгами (с разными ID, естественно);
- При удалении книги - удаляется только один файл из хранилища.

4. Добавляю в пустую базу одно и ту же книгу два раза (хороший ID).
В логе при добавлении по второму разу говорит "Same or older" но
- закладка Авторы - ЛЧ: Автор 1, книг 2; ПЧ: одна книга;
- В поиске выдает 2 книги

С внешним хранилищем все тоже плохо - исключая файлы в хранилище.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение


kis
Новенький участник форума

Новенький участник форума

Зарегистрирован: 26.03.2008
Сообщения: 19

СообщениеДобавлено: Пт Апр 18, 2008 15:03    Заголовок сообщения: Ответить с цитатой

Я тут подумал что в JEFLib 2008-04-14 создание внешнего хранилища вообще не работает Very Happy
Пока не догадался оставить строчку где нужно путь задать пустой.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
Показать сообщения:   
Начать новую тему   Ответить на тему    Список форумов www.fictionbook.org -> Сделано для FB Часовой пояс: GMT + 3
На страницу Пред.  1, 2, 3, 4, 5, 6 ... 12, 13, 14  След.
Страница 5 из 14

 
Перейти:  
Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах


Powered by phpBB © 2001, 2005 phpBB Group