Информационный портал
pocket versionPOCKET  wikiWIKI  FAQFAQ  ПоискПоиск  ПользователиПользователи  ГруппыГруппы  РегистрацияРегистрация  ПрофильПрофиль  Войти и проверить личные сообщенияВойти и проверить личные сообщения  ВходВход

Скрипт добавления сноски (и другие)
На страницу Пред.  1, 2, 3, ... 12, 13, 14  След.
 
Найти сообщения без ответов
Начать новую тему   Ответить на тему    Список форумов www.fictionbook.org -> Сделано для FB
Предыдущая тема :: Следующая тема  
Автор Сообщение


Marina_Ch
Постоянный участник форума

Постоянный участник форума

Зарегистрирован: 14.04.2006
Сообщения: 779
Откуда: Москва

СообщениеДобавлено: Пт Июн 08, 2007 23:24    Заголовок сообщения: Ответить с цитатой

Sclex, ты просто чудо! Я тебя люблю! Сибо-сибо-сибо!!! Благодарность Благодарность Благодарность
(убежала тестировать)
_________________
REB 1100, REB 1200, SE P910i
Вернуться к началу
Посмотреть профиль Отправить личное сообщение


Sclex
Бывалый участник форума

Бывалый участник форума

Зарегистрирован: 24.09.2005
Сообщения: 416
Откуда: Минск

СообщениеДобавлено: Сб Июн 09, 2007 1:34    Заголовок сообщения: Ответить с цитатой

Окошко вроде "обработка закончена" надо в этом скрипте? В v1.0 его нет.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение


Marina_Ch
Постоянный участник форума

Постоянный участник форума

Зарегистрирован: 14.04.2006
Сообщения: 779
Откуда: Москва

СообщениеДобавлено: Сб Июн 09, 2007 7:44    Заголовок сообщения: Ответить с цитатой

Ну, какой-то сигнал бы не помешал, уж очень я нетерпелива. Но и так это просто класс - я все книги конверчу в ФБД и переделка сносок немного... задолбала... А с твоими скриптами просто классно! 2 клика мышкой и все! Огромнейшее облегчение жизни и никаких сторонних программ.
_________________
REB 1100, REB 1200, SE P910i
Вернуться к началу
Посмотреть профиль Отправить личное сообщение


Sclex
Бывалый участник форума

Бывалый участник форума

Зарегистрирован: 24.09.2005
Сообщения: 416
Откуда: Минск

СообщениеДобавлено: Сб Июн 09, 2007 10:57    Заголовок сообщения: Ответить с цитатой

Учти, я теперь сообразил, что пока некорректно обрабатывается ситуация, когда на один абзац указывает несколько возвратных ссылок - удаляется только первая (id абзаца тоже), так что не спеши файлы не глядя прогонять, я это исправлю. И что насчет продолжительности работы на документах серьезных размеров? Пока что алгоритм самый грубый, есть пару способов оптимизации...

Добавлено спустя 2 часа 19 минут 34 секунды:

Удаление возвратных ссылок v1.1. Ссылка 1. Ссылка 2. 1416 Б.

Переделал алгоритм, используя коллекции вместо массивов. Как следствие - значительно большая скорость работы и корректная обработка ситуации, когда на один абзац ссылаются несколько возвратных ссылок.

Также теперь, закончив обработку, скрипт выдает окошко с информацией: сколько удалено возвратных ссылок и id абзацев.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение


Marina_Ch
Постоянный участник форума

Постоянный участник форума

Зарегистрирован: 14.04.2006
Сообщения: 779
Откуда: Москва

СообщениеДобавлено: Сб Июн 09, 2007 13:42    Заголовок сообщения: Ответить с цитатой

Sclex писал(а):
И что насчет продолжительности работы на документах серьезных размеров?

Я на продолжительность не смотрю - обработка в MassTextProcessor однозначно занимает сильно больше времени, особенно если учесть, что она делалась в 3 прохода и каждый раз надо было вводить что на что меняешь. Но за оптимизацию - огромное спасибо.
Ситуация, когда в одном абзаце несколько сносок часта, но при тестировании мне не попалась, спасибо за корректировку.
И за окошко с инфой тоже отдельная благодарность - теперь видно, корректно ли отработал скрипт.
_________________
REB 1100, REB 1200, SE P910i
Вернуться к началу
Посмотреть профиль Отправить личное сообщение


Sclex
Бывалый участник форума

Бывалый участник форума

Зарегистрирован: 24.09.2005
Сообщения: 416
Откуда: Минск

СообщениеДобавлено: Пт Июн 15, 2007 1:34    Заголовок сообщения: Ответить с цитатой

Marina_Ch
jurgennt дал ссылку на файл, в котором не все возвратные ссылки удаляются скриптом. Проверка показала, что в этом файле некоторые возвр. ссылки не имеют соответствующих им id. Например, это характерно для сносок, вложенных в <v> , т.к. этот тег по схеме не может иметь свойства id. Ссылка есть, а куда указывает - не понятно. Так что надо как-то менять/дорабатывать алгоритм. В связи с этим вопрос - текст возвр. ссылок всегда имеет вид вроде [1] , где число равно номеру секции в боди нотесов или это настраивается и следовательно может от случая к случаю различаться? Речь о редакторе, который ты называла. В примечаниях могут быть и другие ссылки, кроме возвратных, хотелось бы их как-то отличать и сохранять. Допустимо ли сделать распознавание по тексту ссылки? Или, может, предпочитаешь по адресу ссылки (#_ednref1)?
Вернуться к началу
Посмотреть профиль Отправить личное сообщение


Marina_Ch
Постоянный участник форума

Постоянный участник форума

Зарегистрирован: 14.04.2006
Сообщения: 779
Откуда: Москва

СообщениеДобавлено: Пт Июн 15, 2007 9:25    Заголовок сообщения: Ответить с цитатой

1. Текст ссылок всегда имеет вид такой, как задано в ворде. например, если в ворде установить i, ii, iii, iv,... - и текст ссылок будет такой, увы.
2. кроме ednref могут быть, увы, и другие варианты Sad Это опять же зависит от того, какие ссылки были в ворде (концевые или страничные) и какой программой шла конвертация (БД или ФБД)

Я сейчас сделаю тестовый файлик и конвертну всеми возможными способами
о результате отпишусь, ок? Просто на память я не помню, если честно.

Добавлено спустя 3 часа 2 минуты 42 секунды:

Сделала.
К сожалению БукДизайнер у меня почему-то заглючил на сносках, могу рассказать только про ФБД.
В ворде есть 2 варианта сносок - обычные и концевые.
Для обычных _ftnref1, для концевых _ednref1
Нумерация нормальная, даже если сноски нумеруются в ворде нестандартно.
Варианты нумерации ворда - 1,2,3..., a,b,c,..., A,B,C,..., i,ii,ii,..., I,II,III,..., *,и т.д.
В любом случае адреса возвратных ссылок формируются с нормальными номерами 1,2,3 и т.д. Просто в ФБД они двух видов _ftnref1 и _ednref1.
Так что вариант с
Sclex писал(а):
по адресу ссылки (#_ednref1)?
вполне приемлим.
Еще б в БД кто-нить смог бы глянуть, как получается - и совсем все было бы ясно.

Добавлено спустя 5 часов 2 минуты 9 секунд:

Столкнулась с новой проблемой.
Вот такие конструкции
Код:
  <section id="_ftn1">
   <p>[1]Плантаторы - владельцы табачных и хлопковых полей, пользующиеся трудом рабов негров.</p>
  </section>
  <section id="_ftn2">
   <p>[2]Аболиционистами называли себя в Америке сторонники освобождения негров.</p>
  </section>

обрабатываются вот так
Код:
  <section id="n_1">
   <title>
    <p>1</p>
   </title>
   <p>[1]Плантаторы - владельцы табачных и хлопковых полей, пользующиеся трудом рабов негров.</p>
  </section>
  <section id="n_2">
   <title>
    <p>2</p>
   </title>
   <p>[2]Аболиционистами называли себя в Америке сторонники освобождения негров.</p>
  </section>

При этом
Код:
<p id="_ftnref1">Однажды к мисс Уайтсайд съехались гости - соседние плантаторы <a l:href="#n_1">[1]</a>. После сытного обеда гости и любезная хозяйка перешли в гостиную.</p>

<p id="_ftnref1"> - не удаляется никаким скриптом. Sad
_________________
REB 1100, REB 1200, SE P910i
Вернуться к началу
Посмотреть профиль Отправить личное сообщение


Sclex
Бывалый участник форума

Бывалый участник форума

Зарегистрирован: 24.09.2005
Сообщения: 416
Откуда: Минск

СообщениеДобавлено: Сб Июн 16, 2007 0:23    Заголовок сообщения: Ответить с цитатой

Удаление возвратных ссылок v1.2. Ссылка 1. Ссылка 2. 1858 Б.

Удаляет возвратные ссылки и id абзацев, вид которых подходит под регэкспы. В данный момент настроено удаление тех, которые начинаются с _ednref или _ftnref (не считая решетки в случае ссылок), и добавить новые маски не составляет труда. Если id абзаца упоминается в ссылке, находящейся не в body примечаний, такой id удален не будет.

В архиве два файла. Версия «ссылки в текст» превращает текст ссылки в простой текст вместо полного ее удаления.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение


Marina_Ch
Постоянный участник форума

Постоянный участник форума

Зарегистрирован: 14.04.2006
Сообщения: 779
Откуда: Москва

СообщениеДобавлено: Вс Июн 17, 2007 23:07    Заголовок сообщения: Ответить с цитатой

Sclex, спасибо! Благодарность Благодарность Благодарность
_________________
REB 1100, REB 1200, SE P910i
Вернуться к началу
Посмотреть профиль Отправить личное сообщение


Sclex
Бывалый участник форума

Бывалый участник форума

Зарегистрирован: 24.09.2005
Сообщения: 416
Откуда: Минск

СообщениеДобавлено: Ср Июн 20, 2007 16:47    Заголовок сообщения: Ответить с цитатой

Marina_Ch писал(а):
3. Хочется подхватывать и конвертить в сноски различные [], {} и т.п. варианты - иногда они полностью пропущены, а иногда быстрее по тексту пробежаться и обрамить сноски [] - а потом сконвертить.

Попытался сделать. Примечания из скобок v1.0. Ссылка 1. Ссылка 2. 3776 Б.

Сыроватая версия, поскольку аварийные ситуации (например, пропущена закрывающая скобка) пока не отлавливаются - скрипт может повиснуть или испортить документ, но на корректных входных данных по идее должен отрабатывать правильно, так что баги при корректных данных можно сообщать.

В архиве два файла, для фигурных и квадратных скобок.

Внутри скобок можно использовать форматирование тэгами strong, emphasis и подобными. Ссылки, если есть внутри скобок, тоже переносятся в примечание. Многоабзацные примечания пока не поддерживаются.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение


Marina_Ch
Постоянный участник форума

Постоянный участник форума

Зарегистрирован: 14.04.2006
Сообщения: 779
Откуда: Москва

СообщениеДобавлено: Ср Июн 20, 2007 17:07    Заголовок сообщения: Ответить с цитатой

Sclex, я тебе говорила, что я тебя люблю? Нет? Ну так говорю!
Спасибо!!!
Благодарность Благодарность Благодарность Благодарность Благодарность
_________________
REB 1100, REB 1200, SE P910i
Вернуться к началу
Посмотреть профиль Отправить личное сообщение


Sclex
Бывалый участник форума

Бывалый участник форума

Зарегистрирован: 24.09.2005
Сообщения: 416
Откуда: Минск

СообщениеДобавлено: Пт Июн 22, 2007 22:51    Заголовок сообщения: Ответить с цитатой

Примечания из скобок v1.1. Ссылка 1. Ссылка 2. 4236 Б.

Теперь обрабатываются следующие ошибки. 1. Количество открывающих тэгов внутри скобок не соответствует числу закрывающих. (Например, <emphasis> открывается до скобки, открывающей примечание, а закрывается после нее, но до закрывающей). 2. Внутри скобок встречен конец абзаца. (Многоабзацные примечания по-прежнему не поддерживаются.) 3. После открывающей скобки встречена опять открывающая, раньше закрывающей.

В случае ошибки обработка прекращается, выдается сообщение и курсор устанавливается на ошибочный абзац.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение


Marina_Ch
Постоянный участник форума

Постоянный участник форума

Зарегистрирован: 14.04.2006
Сообщения: 779
Откуда: Москва

СообщениеДобавлено: Сб Июн 23, 2007 8:52    Заголовок сообщения: Ответить с цитатой

Спасибо за развитие скрипта. Собственно этого как раз и не хватало - указания места ошибки для ее возможной коррекции. Пошла тестировать Wink
Sclex писал(а):
Многоабзацные примечания по-прежнему не поддерживаются

А надо ли? В 99% случаев чекер заменяет разрыв абзаца на // или \\. И потом массовой заменой это все легко заменить обратно.
Кстати - вот и пример алгоритма - сперва проверяем нет ли где разрыва абзаца внутри сноски, заменяем его на что-то типа \/\/\/\/\/\/\ обрабатываем как обычно и меняем обратно.
_________________
REB 1100, REB 1200, SE P910i
Вернуться к началу
Посмотреть профиль Отправить личное сообщение


Marina_Ch
Постоянный участник форума

Постоянный участник форума

Зарегистрирован: 14.04.2006
Сообщения: 779
Откуда: Москва

СообщениеДобавлено: Вт Июл 03, 2007 15:57    Заголовок сообщения: Ответить с цитатой

Sclex писал(а):
Удаление возвратных ссылок v1.2.

Наконец поставила эту версию.
Не работает Sad
Требует определить переменную CheckSimpleLinks:

Код:
Error at line 37:
"CheckSimpleLinks" - определение отсутствует

_________________
REB 1100, REB 1200, SE P910i
Вернуться к началу
Посмотреть профиль Отправить личное сообщение


Sclex
Бывалый участник форума

Бывалый участник форума

Зарегистрирован: 24.09.2005
Сообщения: 416
Откуда: Минск

СообщениеДобавлено: Ср Июл 04, 2007 13:38    Заголовок сообщения: Ответить с цитатой

Marina_Ch писал(а):
Наконец поставила эту версию. Не работает :(

Исправил. Удаление возвратных ссылок v1.3. Ссылка 1. Ссылка 2. 1712 Б.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
Показать сообщения:   
Начать новую тему   Ответить на тему    Список форумов www.fictionbook.org -> Сделано для FB Часовой пояс: GMT + 3
На страницу Пред.  1, 2, 3, ... 12, 13, 14  След.
Страница 2 из 14

 
Перейти:  
Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах


Powered by phpBB © 2001, 2005 phpBB Group