Новый алгоритм, разработанный инженерами Google, автоматически извлекает факты с web-страниц, определяет фактологические ошибки в тексте и вычисляет общий уровень достоверности текста.
Данная оценка будет напрямую влиять на место сайта в поисковой выдаче. Таким образом, Google хочет задвинуть подальше «жёлтые» новостные сайты в пользу более надёжных источников информации, пишет imena.ua.
Извлечение фактов из текста происходит с использованием 16 различных методов извлечения триад данных – субъект, утверждение, объект – с web-страниц.
Технологию опробовали на выборке в 119 млн страниц и 5,6 млн сайтов, которые сравнили с базой из 2,9 млрд фактов, собранных в интернете. Проверка продемонстрировала, что алгоритм практически безупречно отличает факты от вымысла.