Freebase – Открытая Семантическая База Данных Знаний Планеты

by Igor Kandyba

freebase Я говорю «знания», вы говорите – Wikipedia. И это очень даже справедливо, так как более обширной и постоянно пополняемой базы данных человечество ещё не придумало. В Википедии есть в буквальном смысле всё! Но давайте подумаем – а так ли удобно ей пользоваться? Мы вводим запрос, получаем список подпадающих под него записей, отсортированных по релевантности, переходим по ссылке (как в любом поисковике), а дальше всё уже зависит от того, насколько грамотно оформлена статья. Если авторы постарались, то мы увидим в ней ссылки на связанные темы, внешние ссылки, указания на печатную литературу и т.д. А если статья была написана на скорую руку, то кроме самой информации об искомом объекте мы ничего не получим. Грустно, да?

К счастью, есть выход, правда, пока что только в англоязычном интернете. Это поисковые и новостные системы, использующие принципы семантического веба. И одной из лучших таких систем является Freebase, о которой я и хочу рассказать.

Freebase – открытая база данных всей информации мира. Она создаётся комьюнити и для комьюнити, свободна и бесплатна как для пользователей, так и для разработчиков, создающих на её основе различные приложения.

На момент написания статьи Freebase содержала более 4 миллионов тем в сотнях тысяч категорий. Движок использует традиционные мировые базы данных, такие как Wikipedia, MusicBrainz, таким образом мы имеем неисчерпаемый источник информации о кино, музыке, людях, географии, науке, социальной и политической жизни.

Семантическая сущность сервиса заключается в автоматическом определении поискового объекта и подборка всей возможной информации на эту тему. А не тупого списка ссылок, как в поисковиках. Например, я ищу информацию о Дмитрии Медведеве и получаю в выдаче автоматически сформированную страницу с его краткой биографией, фотографией, а также всеми характеристиками, свойственными ему как объекту типа «персоналия» (пол, дата рождения, религия и т.д.). Причем эту страницу можно редактировать вручную, добавляя информацию, организовывая её, таким образом, вскоре такие страницы становятся полноценными информационными хабами. Просто попробуйте, и вы поймёте, как это просто!

Чтобы пользоваться Freebase, надо знать несколько простых внутренних терминов сервиса. Так, Domains (домены) – это общие категории, например, кино, музыка и т.д. Types (типы) – это кирпичики, из которых складываются страницы выдачи, например, при поиске информации о фильме, это актеры, режиссёр, год создания, саундтрэк и т.д. Properties (свойства) – специфические свойства типов, например, для актёра это будут – запись о нём в базе данных IMDB, Википедии, ссылка на его сайт и т.д.  Ну и конечно, Topics (темы) – это основная единица информации, то, что мы ищем.

Обязательно зайдите в раздел «Разработчикам», там находятся уже созданные на основе Freebase программы и сервисы. Например, Parallax – инновационный способ поиска информации по Freebase, Powerset – семантический поисковик, который может отвечать на человеческие вопросы (например, кто убил Джона Кеннеди?) И вообще – все приложения находятся здесь, смотрите сами.

Опробовав сервис в действии, я нашёл его очень даже юзабельным, в отличие от многих подобных прототипов, годящихся разве что для выставок. Им удобно пользоваться, а гигантская база пользователей отлично делает своё дело.

Будущее уже рядом!

http://www.freebase.com/