Google разработал новый алгоритм SMITH

18.03.2021

Недавно интернет сообщество облетела новость о разработке Google нового алгоритма для распознавания текстов . Согласно опубликованной научной статье, новый алгоритм под названием «SMITH» значительно превосходит по функционалу своего предшественника «BERT». Как известно, SEO-алгоритм «BERT» способен определять по SEO-ключам лишь смысл исследуемой части текста. В то время как «SMITH» может предугадать смысл всего текста целиком, с учетом частей, не подвергнутых анализу.

Google smith

Возможности нового алгоритма

Описанные возможности нового алгоритма позиционируют «SMITH» как полноценный элемент искусственного интеллекта. Ведь уметь не только понять написанное, но и догадаться о дальнейшем тексте — это уже далеко не уровень машинной алгоритмической модели. Предшественники «SMITH» всегда работали в концепции «что вижу, то и понимаю». Выйти за пределы исследуемого семантического ядра не способны ни популярный «BERT», ни другие его аналоги.

Алгоритм работы 

Разработчики пока не раскрыли математические модели, по которым «SMITH» способен «размышлять» о смысле текста в еще «не прочитанных» им семантических ядрах. Однако в своей публикации Google слегка приоткрыл завесу тайны. На основе знаний о построениях человеческого языка алгоритм «улавливает» семантические взаимоотношения на уровне предложений в документе. Создатели «SMITH» определяют свое детище как «иерархический кодер, на основе самотрансформирующейся модели для захвата информации, дающей представление о сути всего документа». Разумеется, «SMITH» не может по одному-двум предложениям понять смысл всего текста. Алгоритм выборочно прогоняет через себя определенное количество частей текста и делает «вывод» на основе их изученных семантических ядер.

Из технических характеристик разработчики обозначили способность «SMITH» принимать входной текст длинной 2048 символов, что в 4 раза выше чем у «BERT» (512 символов).

Что нового в алгоритме «SMITH»?

Прежде всего, алгоритм «SMITH» позволяет снять ограничения по длине распознаваемого текста. Алгоритму не требуется прогонять сквозь себя весь текст целиком. Вместе с этим значительно ускоряется время распознавания текста. Как следствие, уменьшается время взаимодействия с другими вспомогательными программами для SEO-анализа и поисковых систем.


Вернуться

Заказать продвижение

Поля, отмеченные * — обязательные для заполнения.