Предыдущая тема :: Следующая тема |
Автор |
Сообщение |
Marina_Ch Постоянный участник форума
Зарегистрирован: 14.04.2006 Сообщения: 779 Откуда: Москва
|
Добавлено: Пт Июн 08, 2007 23:24 Заголовок сообщения: |
|
|
Sclex, ты просто чудо! Я тебя люблю! Сибо-сибо-сибо!!!
(убежала тестировать) _________________ REB 1100, REB 1200, SE P910i |
|
Вернуться к началу |
|
|
Sclex Бывалый участник форума
Зарегистрирован: 24.09.2005 Сообщения: 416 Откуда: Минск
|
Добавлено: Сб Июн 09, 2007 1:34 Заголовок сообщения: |
|
|
Окошко вроде "обработка закончена" надо в этом скрипте? В v1.0 его нет. |
|
Вернуться к началу |
|
|
Marina_Ch Постоянный участник форума
Зарегистрирован: 14.04.2006 Сообщения: 779 Откуда: Москва
|
Добавлено: Сб Июн 09, 2007 7:44 Заголовок сообщения: |
|
|
Ну, какой-то сигнал бы не помешал, уж очень я нетерпелива. Но и так это просто класс - я все книги конверчу в ФБД и переделка сносок немного... задолбала... А с твоими скриптами просто классно! 2 клика мышкой и все! Огромнейшее облегчение жизни и никаких сторонних программ. _________________ REB 1100, REB 1200, SE P910i |
|
Вернуться к началу |
|
|
Sclex Бывалый участник форума
Зарегистрирован: 24.09.2005 Сообщения: 416 Откуда: Минск
|
Добавлено: Сб Июн 09, 2007 10:57 Заголовок сообщения: |
|
|
Учти, я теперь сообразил, что пока некорректно обрабатывается ситуация, когда на один абзац указывает несколько возвратных ссылок - удаляется только первая (id абзаца тоже), так что не спеши файлы не глядя прогонять, я это исправлю. И что насчет продолжительности работы на документах серьезных размеров? Пока что алгоритм самый грубый, есть пару способов оптимизации...
Добавлено спустя 2 часа 19 минут 34 секунды:
Удаление возвратных ссылок v1.1. Ссылка 1. Ссылка 2. 1416 Б.
Переделал алгоритм, используя коллекции вместо массивов. Как следствие - значительно большая скорость работы и корректная обработка ситуации, когда на один абзац ссылаются несколько возвратных ссылок.
Также теперь, закончив обработку, скрипт выдает окошко с информацией: сколько удалено возвратных ссылок и id абзацев. |
|
Вернуться к началу |
|
|
Marina_Ch Постоянный участник форума
Зарегистрирован: 14.04.2006 Сообщения: 779 Откуда: Москва
|
Добавлено: Сб Июн 09, 2007 13:42 Заголовок сообщения: |
|
|
Sclex писал(а): | И что насчет продолжительности работы на документах серьезных размеров? |
Я на продолжительность не смотрю - обработка в MassTextProcessor однозначно занимает сильно больше времени, особенно если учесть, что она делалась в 3 прохода и каждый раз надо было вводить что на что меняешь. Но за оптимизацию - огромное спасибо.
Ситуация, когда в одном абзаце несколько сносок часта, но при тестировании мне не попалась, спасибо за корректировку.
И за окошко с инфой тоже отдельная благодарность - теперь видно, корректно ли отработал скрипт. _________________ REB 1100, REB 1200, SE P910i |
|
Вернуться к началу |
|
|
Sclex Бывалый участник форума
Зарегистрирован: 24.09.2005 Сообщения: 416 Откуда: Минск
|
Добавлено: Пт Июн 15, 2007 1:34 Заголовок сообщения: |
|
|
Marina_Ch
jurgennt дал ссылку на файл, в котором не все возвратные ссылки удаляются скриптом. Проверка показала, что в этом файле некоторые возвр. ссылки не имеют соответствующих им id. Например, это характерно для сносок, вложенных в <v> , т.к. этот тег по схеме не может иметь свойства id. Ссылка есть, а куда указывает - не понятно. Так что надо как-то менять/дорабатывать алгоритм. В связи с этим вопрос - текст возвр. ссылок всегда имеет вид вроде [1] , где число равно номеру секции в боди нотесов или это настраивается и следовательно может от случая к случаю различаться? Речь о редакторе, который ты называла. В примечаниях могут быть и другие ссылки, кроме возвратных, хотелось бы их как-то отличать и сохранять. Допустимо ли сделать распознавание по тексту ссылки? Или, может, предпочитаешь по адресу ссылки (#_ednref1)? |
|
Вернуться к началу |
|
|
Marina_Ch Постоянный участник форума
Зарегистрирован: 14.04.2006 Сообщения: 779 Откуда: Москва
|
Добавлено: Пт Июн 15, 2007 9:25 Заголовок сообщения: |
|
|
1. Текст ссылок всегда имеет вид такой, как задано в ворде. например, если в ворде установить i, ii, iii, iv,... - и текст ссылок будет такой, увы.
2. кроме ednref могут быть, увы, и другие варианты Это опять же зависит от того, какие ссылки были в ворде (концевые или страничные) и какой программой шла конвертация (БД или ФБД)
Я сейчас сделаю тестовый файлик и конвертну всеми возможными способами
о результате отпишусь, ок? Просто на память я не помню, если честно.
Добавлено спустя 3 часа 2 минуты 42 секунды:
Сделала.
К сожалению БукДизайнер у меня почему-то заглючил на сносках, могу рассказать только про ФБД.
В ворде есть 2 варианта сносок - обычные и концевые.
Для обычных _ftnref1, для концевых _ednref1
Нумерация нормальная, даже если сноски нумеруются в ворде нестандартно.
Варианты нумерации ворда - 1,2,3..., a,b,c,..., A,B,C,..., i,ii,ii,..., I,II,III,..., *,и т.д.
В любом случае адреса возвратных ссылок формируются с нормальными номерами 1,2,3 и т.д. Просто в ФБД они двух видов _ftnref1 и _ednref1.
Так что вариант с Sclex писал(а): | по адресу ссылки (#_ednref1)? | вполне приемлим.
Еще б в БД кто-нить смог бы глянуть, как получается - и совсем все было бы ясно.
Добавлено спустя 5 часов 2 минуты 9 секунд:
Столкнулась с новой проблемой.
Вот такие конструкции
Код: | <section id="_ftn1">
<p>[1]Плантаторы - владельцы табачных и хлопковых полей, пользующиеся трудом рабов негров.</p>
</section>
<section id="_ftn2">
<p>[2]Аболиционистами называли себя в Америке сторонники освобождения негров.</p>
</section> |
обрабатываются вот так
Код: | <section id="n_1">
<title>
<p>1</p>
</title>
<p>[1]Плантаторы - владельцы табачных и хлопковых полей, пользующиеся трудом рабов негров.</p>
</section>
<section id="n_2">
<title>
<p>2</p>
</title>
<p>[2]Аболиционистами называли себя в Америке сторонники освобождения негров.</p>
</section> |
При этом
Код: | <p id="_ftnref1">Однажды к мисс Уайтсайд съехались гости - соседние плантаторы <a l:href="#n_1">[1]</a>. После сытного обеда гости и любезная хозяйка перешли в гостиную.</p> |
<p id="_ftnref1"> - не удаляется никаким скриптом. _________________ REB 1100, REB 1200, SE P910i |
|
Вернуться к началу |
|
|
Sclex Бывалый участник форума
Зарегистрирован: 24.09.2005 Сообщения: 416 Откуда: Минск
|
Добавлено: Сб Июн 16, 2007 0:23 Заголовок сообщения: |
|
|
Удаление возвратных ссылок v1.2. Ссылка 1. Ссылка 2. 1858 Б.
Удаляет возвратные ссылки и id абзацев, вид которых подходит под регэкспы. В данный момент настроено удаление тех, которые начинаются с _ednref или _ftnref (не считая решетки в случае ссылок), и добавить новые маски не составляет труда. Если id абзаца упоминается в ссылке, находящейся не в body примечаний, такой id удален не будет.
В архиве два файла. Версия «ссылки в текст» превращает текст ссылки в простой текст вместо полного ее удаления. |
|
Вернуться к началу |
|
|
Marina_Ch Постоянный участник форума
Зарегистрирован: 14.04.2006 Сообщения: 779 Откуда: Москва
|
Добавлено: Вс Июн 17, 2007 23:07 Заголовок сообщения: |
|
|
Sclex, спасибо! _________________ REB 1100, REB 1200, SE P910i |
|
Вернуться к началу |
|
|
Sclex Бывалый участник форума
Зарегистрирован: 24.09.2005 Сообщения: 416 Откуда: Минск
|
Добавлено: Ср Июн 20, 2007 16:47 Заголовок сообщения: |
|
|
Marina_Ch писал(а): | 3. Хочется подхватывать и конвертить в сноски различные [], {} и т.п. варианты - иногда они полностью пропущены, а иногда быстрее по тексту пробежаться и обрамить сноски [] - а потом сконвертить. |
Попытался сделать. Примечания из скобок v1.0. Ссылка 1. Ссылка 2. 3776 Б.
Сыроватая версия, поскольку аварийные ситуации (например, пропущена закрывающая скобка) пока не отлавливаются - скрипт может повиснуть или испортить документ, но на корректных входных данных по идее должен отрабатывать правильно, так что баги при корректных данных можно сообщать.
В архиве два файла, для фигурных и квадратных скобок.
Внутри скобок можно использовать форматирование тэгами strong, emphasis и подобными. Ссылки, если есть внутри скобок, тоже переносятся в примечание. Многоабзацные примечания пока не поддерживаются. |
|
Вернуться к началу |
|
|
Marina_Ch Постоянный участник форума
Зарегистрирован: 14.04.2006 Сообщения: 779 Откуда: Москва
|
Добавлено: Ср Июн 20, 2007 17:07 Заголовок сообщения: |
|
|
Sclex, я тебе говорила, что я тебя люблю? Нет? Ну так говорю!
Спасибо!!!
_________________ REB 1100, REB 1200, SE P910i |
|
Вернуться к началу |
|
|
Sclex Бывалый участник форума
Зарегистрирован: 24.09.2005 Сообщения: 416 Откуда: Минск
|
Добавлено: Пт Июн 22, 2007 22:51 Заголовок сообщения: |
|
|
Примечания из скобок v1.1. Ссылка 1. Ссылка 2. 4236 Б.
Теперь обрабатываются следующие ошибки. 1. Количество открывающих тэгов внутри скобок не соответствует числу закрывающих. (Например, <emphasis> открывается до скобки, открывающей примечание, а закрывается после нее, но до закрывающей). 2. Внутри скобок встречен конец абзаца. (Многоабзацные примечания по-прежнему не поддерживаются.) 3. После открывающей скобки встречена опять открывающая, раньше закрывающей.
В случае ошибки обработка прекращается, выдается сообщение и курсор устанавливается на ошибочный абзац. |
|
Вернуться к началу |
|
|
Marina_Ch Постоянный участник форума
Зарегистрирован: 14.04.2006 Сообщения: 779 Откуда: Москва
|
Добавлено: Сб Июн 23, 2007 8:52 Заголовок сообщения: |
|
|
Спасибо за развитие скрипта. Собственно этого как раз и не хватало - указания места ошибки для ее возможной коррекции. Пошла тестировать
Sclex писал(а): | Многоабзацные примечания по-прежнему не поддерживаются |
А надо ли? В 99% случаев чекер заменяет разрыв абзаца на // или \\. И потом массовой заменой это все легко заменить обратно.
Кстати - вот и пример алгоритма - сперва проверяем нет ли где разрыва абзаца внутри сноски, заменяем его на что-то типа \/\/\/\/\/\/\ обрабатываем как обычно и меняем обратно. _________________ REB 1100, REB 1200, SE P910i |
|
Вернуться к началу |
|
|
Marina_Ch Постоянный участник форума
Зарегистрирован: 14.04.2006 Сообщения: 779 Откуда: Москва
|
Добавлено: Вт Июл 03, 2007 15:57 Заголовок сообщения: |
|
|
Sclex писал(а): | Удаление возвратных ссылок v1.2. |
Наконец поставила эту версию.
Не работает
Требует определить переменную CheckSimpleLinks:
Код: | Error at line 37:
"CheckSimpleLinks" - определение отсутствует |
_________________ REB 1100, REB 1200, SE P910i |
|
Вернуться к началу |
|
|
Sclex Бывалый участник форума
Зарегистрирован: 24.09.2005 Сообщения: 416 Откуда: Минск
|
Добавлено: Ср Июл 04, 2007 13:38 Заголовок сообщения: |
|
|
Marina_Ch писал(а): | Наконец поставила эту версию. Не работает :( |
Исправил. Удаление возвратных ссылок v1.3. Ссылка 1. Ссылка 2. 1712 Б. |
|
Вернуться к началу |
|
|
|
|
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете голосовать в опросах
|
Powered by phpBB © 2001, 2005 phpBB Group
|