Bookworm: онлайн-сервис по вытягиванию книг с books.google.com

Аватар пользователя DeMorte

Однажды в студеную зимнюю пору искал я на просторах интернета одну очень редкую и нужную мне книжку. В удобоваримом электронном виде (в т.ч. легальном) ее нигде не было, в бумажном — только потрепаный жизнью б/у экземпляр на Амазоне и с доставкой из Бразилии. Вообще, в книжном мире издатели ведут довольно странную игру: отстреливают пиратов, закрывая околонаучные онлайн-библиотеки (к примеру, свежеоткинувший копыта library.nu), но редкие и старые книги не переиздают, а в электронном виде ни с кем ими не делятся. В этот замкнутый круг я и угодил всеми четырьмя ногами.

Книга неожиданно нашлась в Google Books в режиме ограниченного просмотра. Рабочих адекватных способов повыдергивать видимые страницы найти не удалось (да, я знаю о преставившемся gbd и хитром userscript’е для greasemonkey) и решил я поэкспериментировать самостоятельно. Экспериментировал я почти две недели, и в результате исторгнул из себя простенький снаружи сервис по высасыванию книг с books.google.com: http://bookworm.evil.so./

Далее

!ОБРАТИ ВНИМАНИЕ! САМОPR

UPD. ПРОСЬБА ИСПОЛЬЗУЮЩИМ ОТПИСАТЬСЯ (ИЛИ ПОДЕЛИТЬСЯ) РЕЗУЛЬТАТАМИ. СПАСИБО

UPD2: ежели страницы книги нельзя просмотреть в интерфейсе books.google.com, то выкачивать в ней нечего, не стоит пытаться. Вытягиваются книги только с ограниченным и полным просмотром.

UPD3: ВСЕМ РЕКОМЕНДУЮ ОЗНАКОМИТЬСЯ-СНИМАЕТ МАССУ ВОПРОСОВ ПО СЕРВИСУ: ФОРУМ bookworm.evil.so

UPD3.2: ВСЕМ РЕКОМЕНДУЮ ОЗНАКОМИТЬСЯ-СНИМАЕТ МАССУ ВОПРОСОВ ПО СЕРВИСУ: !!!НОВЫЙ ФОРУМ bookworm.evil.so

UPD4: АЛЬТЕРНАТИВНЫЙ РЕСУРС: http://www.gbooksdownloader.com/ (он поддерживает только книги с пометкой "полное представление")

Комментарии

Аватар пользователя Isais

Зарегался. Я ж правильно понял - работает только с зарегистрированными и он-лайн? Буду юзать. Надеюсь, поможет. Спасибо заранее!
Еще бы такой же сервис для gallica.fr ... Как вспомню, что пытался найти объяснение французской фишки в книге 1815 года - так холодным потом покрываюсь.

Аватар пользователя XtraVert

Прикольно. Закинул 4 книжки, около 6 утра. Сейчас, 20.16 - все скачаны примерно наполовину... Посмотрим сколько времени займет полная скачка.

Аватар пользователя laurentina1

Я так поняла, книгу надо раз в несколько дней по новой скачивать и сравнивать, так?
У той, что я сейчас качаю, на books.google.com указано 688 страниц, а на Bookworm -581, т.е. 107 не хватает

собственно, наблюдения за поведением гуглкниг показывают, что и через месяц не все страницы могут быть доступны, надо пробовать заходить через прокси разных стран,
есть предположение что разным странам выдается доступ к определенному проценту от общего числа страниц,
причем какие именно это будут страницы каждый раз решается по новому

Одна книга скачалась за 11 дней (465 стр)
вторая 243 стр. за 12(!) часов
при визуальном просмотре - вроде бы без пропусков
На закачке стоит ещё 12 шт. Смотрим ))

Скачал книгу(406 стр.) за 2 дня. Книга в полном доступе, но практически нет иллюстраций, что делает книгу просто ненужным файлом. Вместо них или надпись "Материал защищен авторским правом", или пустота. Но это проблема не сервиса, а гуглокниги.
Вывод такой: можно скачивать книги, где картинок или нет, или они не являются необходимыми.

Аватар пользователя Isais

По неизвестной причине книга, у которой выкачалась - еще вчера - 541 страница из 588, сегодня исчезла из списка запрошенных мною, у остальных - статус ERROR. Что за?.. Сервис отследили, дырку закрыли?

Аватар пользователя laurentina1

А у меня все застряли, кому 12 страниц недостает, кому семь, кому две... Уже несколько дней нет движения

Аватар пользователя XtraVert

Скачалось 2 книги, у каждой не хватает около 5 страниц. С остальными - такая же ситуация: количество страниц на Bookworm и на гуглокниге не совпадает.
Пустая затея.

Аватар пользователя laurentina1

XtraVert написал:
Скачалось 2 книги, у каждой не хватает около 5 страниц. С остальными - такая же ситуация: количество страниц на Bookworm и на гуглокниге не совпадает.
Пустая затея.

Вы еще счастливчик - в моей книге нет почти 30 страниц, из 285 скачалось 257. С тем же успехом я могла ее скриншотить, быстрее бы вышло по времени - две недели
DeMorte , а доработать как-то никак нельзя?
Аватар пользователя DeMorte

laurentina1 написал:
XtraVert написал:
Скачалось 2 книги, у каждой не хватает около 5 страниц. С остальными - такая же ситуация: количество страниц на Bookworm и на гуглокниге не совпадает.
Пустая затея.

Вы еще счастливчик - в моей книге нет почти 30 страниц, из 285 скачалось 257. С тем же успехом я могла ее скриншотить, быстрее бы вышло по времени - две недели
DeMorte , а доработать как-то никак нельзя?

Судя по тому что сервис на стадии BETA, дорабатывать будут.
Пропусков страниц больше, чем указано (пустые страницы Гугл видимо считает, но не сканирует) Видимо дело или в изначально неверном помещении неполной книги в категорию "полная, но с ограниченным просмотром" или какие-то сбои сервиса.

DeMorte, спасибо, очень интересный сервис.

Вопрос про книги, которые нельзя просмотреть в интерфейсе books.google.com, они вообще никому не доступны? Я, вроде, где то читал, что через американские прокси их можно посмотреть. Но у меня, например, не получилось. Для чего то эти книги присутствуют, или это только обложки?

Аватар пользователя DeMorte

konst1 написал:
DeMorte, спасибо, очень интересный сервис.

Вопрос про книги, которые нельзя просмотреть в интерфейсе books.google.com, они вообще никому не доступны? Я, вроде, где то читал, что через американские прокси их можно посмотреть. Но у меня, например, не получилось. Для чего то эти книги присутствуют, или это только обложки?

Для IP той или иной страны робот Гугла отдаёт разное количество страниц и по-разному определяет категорию книги. Кому что-то кому ничего. Прокси-сервера помогут, но гарантии нет.

Интересное обсуждение сервиса здесь:
http://habrahabr.ru/post/140130/

И вообще интересный блог автора http://habrahabr.ru/users/shuttie/topics/

Не работает этот сервис. Почти совсем. Некомплектную россыпь страниц я и вручную быстрее соберу.
Смысл был не в том, чтобы так вытягивать, а чтобы вытягивать те книжки, для которых якобы "нет электронной версии". На самом-то деле она есть, поиском по тексту книги нужный фрагмент находится -- а как это без электронной версии?;) Так что нехуя господам из гугля людей обманывать.

А вот если включить параною, и допустить, что сервис сей создавался, мягко говоря, не только в этих целях, то...

есть ли шанс на возобновление сервиса?

>> Есть ли шанс на возобновление сервиса?
+1

Какой прекрасный был сервис! Неужели погиб навсегда?

Аватар пользователя DeMorte

muhazeze написал:
Какой прекрасный был сервис! Неужели погиб навсегда?

вопросы к нему: http://habrahabr.ru/users/shuttie/
Аватар пользователя sergio147

Товарищи, кто нибудь связался с Шутти?

Неужели BookWorm последовал за другими замечательными изделиями: гигапедией и GBD?

Остаётся последняя надежда на GreasyMonkey скрипт...

X