28 Ноября 2013 | 09:56

Пермские разработчики создают гибрид СМИ и поисковика - генератор новостных хроник

«Генератор сводных новостных хроник TimeLineGen» - такой проект разрабатывает сейчас аспирант пермского госуниверситета Лиана Ермакова совместно со своими научными руководителями. Генератор новостных хроник – это не поисковик и не агрегатор новостей в традиционном варианте, но нечто похожее на них с дополнительными возможностями. Суть в том, что из множества статей по определенной теме система формирует одну, в которой события изложены в хронологическом порядке. 

Как это будет работать? Лиана Ермакова пояснила ТЕКСТУ, что система сначала ищет информацию по запросу пользователя (на новостных порталах и в открытых источниках). После этого релевантная информация анализируется. 

Во-первых, система анализирует, когда именно произошло событие. Это позволяет создать истинную хронику, потому что сейчас новостные порталы сортируют новости по дате публикации, а TimeLineGen будет выстраивать список событий именно в том хронологическом порядке, в каком они и происходили. То есть, это будет в прямом смысле «хроника». 

Во-вторых, анализируется тональность текстов. Что это значит? «Тональный анализ статей и комментариев позволит выяснить отношение общественности к объекту запроса и понять, как оно менялось,- объясняет Лиана Ермакова. – К примеру, по запросу "реформа образования" мы получим хронику новостей и на их основе построим график отношения общественности к данной реформе. Это нужно в основном для социальных, политических, имиджевых и др. исследований. Это мониторинг общественного мнения». 

Далее несколько похожих статей объединяются в одну. При этом в ней, например, расшифровываются термины. В конце концов, из таких проанализированных и обработанных текстов создается сводная хроника.
 
Разработчики полагают, что такой «генератор новостных хроник» будет интересен электронным СМИ и тем компаниям, которые имеют на своих сайтах новостные блоки. Этот модуль они смогут встраивать на свои сайты. В результате тематические ленты не придется формировать вручную, так как модуль будет это делать автоматически. Кроме того, объясняет Лиана, cейчас сайты создают новостные ленты на ограниченное количество тем: «Возможность на лету создать ленту по пользовательскому запросу (например, «университеты Перми») отсутствует в принципе».
TimeLineGen позволит сделать это. «Что-то похожее реализуется с помощью вручную проставляемых тегов или поиска, что позволяет найти все новости с определенным тегом или поискать по ключевым словам. Наша технология улучшит этот механизм». 
Анастасия Костина (ежедневная пермская интернет-газета ТЕКСТ). Новости Перми, авторские колонки и обзоры на сайте chitaitext.ru.
Подпишитесь на «ТЕКСТ» в любимой соцсети


и получайте свежие тексты к себе в ленту!