Зарегистрироваться
Восстановить пароль
FAQ по входу

Equator

Материалы пользователя

  • Загружено 11 файлов
  • Внесено 4 предложения

Комментарии

в профиле Equator #
Результат дискуссии про OCR - всю ветку диалога удалили.
Отаки дела.
Опальная тема, однако. Вот уж никак не ожидал. :)
в профиле Equator #
Вся ветка у Вас в профиле.
в профиле Equator #
Эт я понял - копию мне оставили. Демократия, однако.
Что я писал - я и так помню, мне копии не нужны.
Я о том, что и админам это не нужно - а вот это для меня сюрприз. Большой. Огромный.
Это не сюрприз. Это капец.
в профиле Equator #
Это вполне себе подлинник.
в профиле Equator #
Логика у вас изумительная.
Когда говорится и снесённой ветке, то имеется в виду, что ветка снесена, чтобы закрыть дискуссию и стереть в истории обсуждений даже сами следы об этом вопросе.
Рот вы закрыли - дело сделано. Безграмотно и позорно.
Но в профиле оставили "подлинники". Спасибо, вы очень добры. :)
в профиле Equator #
Если Вам угодно позиционировать себя как "жертву режима", запретить мы Вам этого не можем, только, пожалуйста, по меньшей мере не стоит этого делать в профилях третьих лиц.
в профиле Equator #
Хотите заработать 1200 баллов? нужно отредактировать книгу одну, удалив лишнее с полей
в профиле Equator #
Как указывать наличие OCR?
А то я выложил книгу с OCR, указал наличие OCR в конце описания книги, а админ просто стёр этот мой комментарий.
Т.е. наличие OCR вообще в параметрах книг не указывается.
Но кое-где, я смотрю, наличие OCR указывают так:
"+OCR
М.: Просвещение, 1983.—207 с."
Сомневаюсь, что это правильно. Это скорее фантазии. Но админы такое пропускают.
в профиле Equator #
В отличие от рутрекера здесь не придираются к ocr, и прочим особенностям распознавания качества. Но всегда можно выложить улучшенную версию, заменив более файл худшего качества
в профиле Equator #
При чём здесь придираются? Странный комментарий.
Я вот для себя делаю OCR, мог бы выложить копии на twirpx.
Но я смотрю, такой параметр не предусмотрен в описании книги.
Есть OCR, нету OCR - всё равно, да?
А ведь работать с книгами с OCR намного удобнее.
странно. очень.
в профиле Equator #
Вы неверно поняли меня, не придираются -в смысле, что нигде в описании не требуется указывать наличие/отсутствие OCR. В отличие от того же рутрекера. Если вы обработали книгу с твирпкса, распознали Finereader-om, вычистили ошибки, то конечно, этот файл будет полезнее, чем просто голые сканы
в профиле Equator #
нигде в описании не требуется указывать наличие/отсутствие OCR. В отличие от того же рутрекера.
Это вы компетентно заявляете или это мнение?
Дело в том, что если не требуется, значит, и не придаётся значения/не ценится.
И если не требуется, то это не значит, что это параметр в описании не должен быть стандартизован.
Как указывать наличие OCR? Как кому вздумается?
И если я буду выкладывать здесь книги, единственное отличие которых от уже имеющихся будет наличие OCR с ошибками, то как на это смотрят админы?
в профиле Equator #
Я с некоторых пор обнаружил, что ошибки можно и не вычищать (это нереальный труд для библиотеки, да и не очень нужный).
OCR с ошибками (сырец, как есть) даёт возможность работы с текстом в pdf-программах (выделения, подчёркивания текста, быстрое создание закладок, поиск по тексту...).
OCR с ошибками даёт возможность поиска по тексту внутри своей библиотеки с помощью Архивариус 3000.
Когда я это осознал, то резко захотелось сделать OCR своей библиотеки :)
И с тех пор я озаботился параметром OCR.
в профиле Equator #
Все уже прописано в правилах.
Добавлять материал не стоит, если за улучшение выдается только:
3. Автоматический OCR без вычитки и правки (формулы, схемы и рисунки в текстовом слое превращены в мусор);
Читайте правила, там все есть! а насчет описания, бывает когда книжка нужна и находишь только в одном экземпляре, а там уже без разницы какого она качества, распознана или нет
в профиле Equator #
Э, этож разные вещи.
Если после OCR с ошибками документ преобразован в текст, то этот документ становится мусором.
А если OCR с ошибками добавляется в качестве нижнего текстового слоя к графическому pdf, djvu, то ценность документа значительно увеличивается.
в профиле Equator #
Согласитесь, что найти книгу - отсканировать/отфотографировать 200-400 страниц, собрать воедино гораздо сложнее и трудоёмко, нежели скормить файл файнридеру и через полчаса обработки сохранить со спрятанным оср слоем? Просто заменять файл на основании того , что был добавлен скрытый оср слой, без какой либо доп.обработки - неправильно.
в профиле Equator #
Текстовый слой в многостраничном изображении PDF/DJVU даёт возможность выполнять полнотекстовый поиск в книге, что резко повышает ценность файла.
в профиле Equator #
Вы с большим массивом инфы когда-нибудь работали? Вижу, что нет. :(
Тех. сайты с поиском по оцифрованной библиотеке работают именно по базе данных OCR с ошибками.
Т.к. вычитать тысячи тех.книг абсолютно нереально (реально только с гос.поддержкой)
Научная библиотека OCR с ошибками - это большое дело. Это вам скажет любой, кто хоть раз пользовался поиском по научной библиотеке.
Более того, OCR с ошибками для научной библиотеки - это необходимость! А иначе как осуществлять поиск?
А читать учебники без OCR-слоя как? Ни подчеркнуть текст нельзя, ничего :(
А о чем вы? О художественной литературе? Да, там нет смысла.
Да уж. Печально всё это.
В этом разделе нет комментариев.