Новости на КузИнфо (Кузбасский Информационный портал - KuzInfo.ru)

КуZбасс - zaРодину (#куZбасс - #zaРодину)

Синонимайзер (Sinonimayzer)

Синонимайзер — программа, осуществляющая замену слов или фраз во введённом тексте на синонимы, находящиеся в базе данных с целью видоизменения текста и придания ему уникальности. Чаще всего используется при создании уникального контента в Интернете. Может быть оформлена в виде сайта в Интернете, скрипта и т. п.


Иногда синомайзер называют так: синомизатор, синонимайзер, синонимизатор. Термин впервые введен копирайтером под ником Кевиндарк на одном из SEO-форумов, для описания программы, которая облегчает рерайтинг текстов. Однако, сейчас под этим словом понимается программа способная автоматически изменять правку, возможно с контролем качества человека.

 

Принципы работы

Все синонимайзеры можно разделить на ручные и автоматические. Ручные синонимайзеры предлагают пользователю самому выбирать подходящие синонимы из списка доступных, автоматические программы и сервисы проделывают всю работу над текстом без участия человека

Для автоматического синомайзинга используются два типа замен: безморфологические(строковые) и морфологические (словарные).

* Безморфологические (строковые) замены проводятся тогда, когда часть текста, имеющая с двух сторон не буквенные символы (пробелы, знаки препинания и другие) полностью совпадает с текстом указанным в замене.

* Морфологические(словарные) замены учитывают морфологию, заменяя слова в любой словоформе на их синонимы в соответствующей словоформе. Некоторые программные продукты способны изменять словосочетания на словосочетания (длиной до десяти слов).

Часть синомайзеров способна проводить оба типа замен, остальные только один из них. В случае, если программа не способна понимать морфологию, то база под неё склоняется в разные словоформы вручную или с помощью утилит называемых склоняторами. Некоторые программы-синомайзеры способны обрабатывать регулярные выражения или простые скриптовые языки.

Из-за того, что в некоторых контекстах синонимы могут не подходить (например, замена «Российская» на «Русская» в словосочетании «Российская Федерация»), в большинстве синомайзеров предусмотрен механизм исключений. Подобные словосочетания заносятся в базу и не обрабатываются.

 

Проблема создания качественного синонимайзера

На сегодняшний день не было разработано ни одного синонимайзера, обрабатывающего русскоязычный текст так же хорошо, как и человек. Главные проблемы в создании качественного синонимайзера связаны со следующим:

* подбор синонимов должен зависеть от контекста фразы;

* русский язык не ставит жестких рамок касательно последовательности слов в предложении, что затрудняет синтаксический анализ;

* чтобы синонимизированный текст читался легко, при работе синонимайзера должен учитываться закон Зипфа (проще говоря, частые слова нужно заменять частыми, а редкие - редкими).


Дополнительная обработка

Статьи, полученные путем генерирования при помощи синонимайзера требуют обязательной дальнейшей обработки программами для пакетного сравнения текстов. В процессе обработки полученные тексты сравниваются между собой, после чего отбираются наиболее уникальные варианты. Материалы с малой долей уникальности не пригодны для дальнейшего использования.

Publish modules to the "offcanvas" position.

Copyright © 2008-2023. Кузбасский Информационный Портал - KuzInfo.ru

Официальные аккаунты КузИнфо.ру в соцсетях: Одноклассники, ВКонтакте, Яндекс ДзенRutube@ПульсRSS

Instagram и Facebook (Metа) запрещены в РФ за экстремизм.