8 способов получения уникального контента которые уже не работают

Давным-давно, когда Яндекс еще не вывел свой АГС на позиции, а Topsape небыло и в помине одной из основных проблем сателлитостроителей был поиск уникального контента. Поскольку я и сам промышлял в те времена сателлитами у меня были свои скромные наработки на эту тему (хотя уверен, что подобными способами пользовался не только я, но и многие другие). Сейчас подобной ерундой я уже не занимаюсь, поэтому решил поделиться темы способами, которые я тогда использовал (или не использовал, но знал о них) для получения уника.

Начну пожалуй с банального:

1. Синонимайзинг. Да-да, стандартный машинный синонимайзинг, когда-то он прекрасно работал. Имея продвинутый синонимайзер и качественную базу синонимов можно было вполне спокойно получать тонны уникального контента на автомате. А если его потом дорабатывать вручную, то он еще и вполне читабельным получался, но это уже на любителя.

2. Перевод. Вполне неплохо можно было переводить контент (например, Гугло-переводчиком) и при минимальной доработке (или даже без нее) делать на основе этого сайты. А уж с украинского на русский, так вообще отличный перевод получается. Жаль только, что на украинском мало сайтов с уникальным контентом, да и подобный перевод на русский чужого труда в промышленных масштабах портит карму.

3. Скан. Куда же без него. Думаю благодаря стараниям манимейкеров-сателлитостроителей в рунете с помощью Гугла вполне можно найти в оцифрованном виде практически любую книгу. К слову качественный скан (в плане хорошо обработанный, красиво оформленный и адаптированный к вебу) цениться Яндексом до сих пор. Вот только это в 99% нарушение авторских прав, а значит потенциально карается по закону.

Теперь чуть более оригинальные, но все же весьма распространенные варианты:

4. Восстановление сайтов из Вебархива. Там содержаться тонны уникально, а главное качественного контента, главное лишь уметь его находить и выковыривать. Но стоит помнить, что теоретически вы, как и со сканом, нарушаете чьи-то авторские права.  Да вполне возможно, что кто-то уже использовал этот контент, а то и не раз. К тому же в вабархиве много нет, поэтому более продвинутые адепты данного метода пишут свои парсеры инета и самостоятельно сохраняют чужие сайты в надежде, что они скоро канут в лету.

5. Заимствование контента с сайтов (или их разделов), которые поисковики не могут проиндексировать, но пользователя могут просмотреть. Самым популярным источником тут пожалуй был Вконтакте - для него можно без труда найти множество всевозможных парсеров. Но на сам деле таких сайтов огромное множество (вспомните про invisible web), главное лишь уметь их искать.

6. Различные генераторы контента (или даже готовых сайтов). Под этим пунктом я подразумеваю все то огромное множество методик и скриптов, позволяющих генерироваться псевдоконтент (псевдо, потому, что он лишь на первый взгляд кажется созданным для людей, а на самом деле является полным бредом). Вариантов тут настолько много, что не буду даже пытаться их описать, скажу лишь, что такая штука есть даже у Яндекса.

Ну а теперь более экзотические варианты:

7. RPG. Может быть вы не знали, но многие RPG-игры содержат тонны уникальных и довольно качественных текстов. Например, в классической RPG Planescape: Torment объем диалогов - порядка 1млн. слов (т.е. это несколько тысяч страниц текста). А ведь таких игр десятки, и для сайтов им посвященных очень просто сделать уникальное и красивое оформление.

8. Узкотематические сайты-агрегаторы анонсов на основе парсинга RSS. Вполне несложно объединить RSS-ки нескольких (десятков) сайтов одной узкой тематики в один поток и транслировать его на своем сайте. При этом мы берем лишь краткие анонсы со ссылкой на оригиналный сайт-источник новости/статьи. Фишкам в том, что такие сайты могут быть весьма востребованными людьми (особенно если прикрутить к этому рейтинг постов, наподобии news2.ru), но для этого нужно довольно сильно над ними поработать. В противном случае такие сайты улетают под АГС на раз. Если же все сделать правильно они могут быть практически вечным источником автоматически обновляющего контента.

На этом пожалуй на сегодня закончу.

Комментарии

02.12.2010 - 23:33

C чего вы взяли что они все не работают?)) Некоторые до сих пор актуальны

02.12.2010 - 23:33

Хороший вопрос :) Думаю я дам на него развернутый ответ в следующем посте.

02.12.2010 - 23:34

Про вариант с RPG не слышал вообще, он меня поразил ))
Это практически СДЛ выходит, но с огромнейшей кучей никому не нужных диалогов…

Радует что ни мою 1-ю ни 2-ю контентные темы не спалил

02.12.2010 - 23:37

Что-то не совсем догнал про RPG. Наверное потому что в RPG не играю. Где они их там содержат?

02.12.2010 - 23:37

В любой достойной РПГ есть огромное количество диалогов – а это довольно качественный, хотя и весьма специфический по структуре уникальный контент. Плюс есть описание различных внутриигровых предметов, навыков, классов/рас, истории мира/локаций и т.д. Главное уметь оформить этот контент так, чтобы он выглядел как созданный для людей. Например, диалоги можно оформить в виде цитатника, многие игровые сайты так делают.

04.05.2011 - 03:33

Есть ещё один способ добычи уникального контента. Это программы распознавания речи. Правда под винду боле менее адекватного софта пока ещё нет, но думаю через годок другой всё наладится. Потому как под андроид на смартфонах распознавание чуть ли не 99% правильное. Не даром гугл вводит голосовой поиск направо и налево.

Добавить комментарий