Стратегия SEO

Согласен ли Google с небольшими изменениями в машинном переводе?

Октябрьские рабочие часы Google по поисковой оптимизации ответили, можно ли использовать автоматически переведенный контент, который был проверен человеком и подвергнут лишь незначительным изменениям редактирования.

Эпизод Google SEO-Office Hours

В этом выпуске видеовстречи в рабочее время используется новый формат, в котором задаются вопросы и даются ответы.

На вопросы отвечают гуглеры Лиззи Сассман и Джон Мюллер.

Лиззи Сассман (англ.@окайлиззи) — технический писатель, который «заботится» о документации Google Site Central.

В отличие от предыдущего живого формата, когда зрители задают вопросы в режиме реального времени, здесь нет возможности задать уточняющие вопросы.

Это приводит к тому, что ответы очень похожи на документацию Google, и никто не может задать оставшиеся вопросы.



Человек, задавший вопрос, был обеспокоен тем, что их контент был машинным переводом с другого языка.

Они наняли редакторов-людей для проверки контента, который был признан приемлемым, за исключением незначительных изменений.

Естественно, человек, задающий вопрос, обеспокоен тем, достаточно ли «незначительных правок», чтобы сделать контент приемлемым для Google.

Лиззи Сассман отвечает на вопрос, строго придерживаясь того, что указано в документации Google.

Возможно, ответ можно было бы уточнить с помощью дополнительного вопроса, чтобы определить, достаточно ли хороши «незначительные изменения». В конце концов, вопрос прямо спрашивает, достаточно ли незначительных изменений для Google.

Возможно, подразумеваемый ответ заключается в том, чтобы использовать ваше суждение о качестве переведенного контента.

Судите сами.

Приемлем ли умеренно отредактированный контент с машинным переводом?

Они спросили:

«Сайт использует машинный перевод, чтобы публиковать сообщения на других языках.

Контент проверяется переводчиками-людьми, и они часто остаются довольны качеством после незначительных изменений.

Это нормально для Google?»

Лиззи Сассман из Google ответила:

«Что ж, приятно слышать, что переводчики-люди довольны, и это совершенно нормально для Google, если в процессе рецензирования участвует человек. Это ключ.

На что вы должны обращать внимание, так это на то, чтобы качество оставалось хорошим и хорошо работало для людей, которые читают контент».

В ответе конкретно не говорится, допустимы ли незначительные правки, а только то, что если «человеки-переводчики» хорошо с этим справляются, то это должно быть хорошо для Google.

Может ли быть так, что Google не проверяет, переведен ли контент автоматически, а полагается на стандартные сигналы качества контента?

Мы не знаем.

Новый формат рабочих часов не дает лицу, задающему вопрос, возможность задать дополнительный вопрос.

Политика Google в отношении спама

В документации для разработчиков Google о спам-контенте упоминаются инструменты автоматического перевода текста и прямо говорится, что это спам, за исключением случаев, когда в нем участвует человеческий фактор.

Вот что говорится в документации Google:

«Примеры спам-контента, сгенерированного автоматически, включают:

Текст, переведенный с помощью автоматизированного инструмента, без проверки или проверки человеком перед публикацией».

Таким образом, из опубликованных рекомендаций Google ясно, что до тех пор, пока человек редактирует машинно-переведенный контент, Google будет с этим согласен.

Кроме того, в видеоролике Google Office-Hours от апреля 2022 года Джон Мюллер упомянул, что контент, созданный ИИ, считается спамом, а затем упомянул контент с автоматическим переводом.

Мюллер рассказал об инструментах для создания контента с помощью ИИ и сравнил их с инструментами автоматического перевода.

На отметке 24:55 минуты видео Office-Hours за апрель 2022 года Мюллер сказал:

«Я думаю, я не знаю, со временем, может быть, это что-то, что будет развиваться, в том смысле, что это станет больше инструментом для людей.

Это похоже на то, как если бы вы использовали машинный перевод в качестве основы для создания переведенной версии веб-сайта.

Но вы все равно… в основном работаете с этим вручную».

Почему человек должен проверять автоматически переведенный контент?

Как упоминалось выше, Google заботится о том, чтобы контент, на который ссылаются страницы результатов поисковой системы (SERP), был высокого качества и чтобы пользователи были им довольны.

Что-то, что не обсуждалось, это то, что переведенный контент содержит подписи, которые может идентифицировать алгоритм обнаружения перевода.

Обнаружение контента с машинным переводом исследуется уже много лет.

Исследовательская работа от 2021 года (Обнаружение машинного перевода текста по сходству текста с двусторонним переводом – Загрузка в формате PDF) утверждает, что контент, переведенный с одного языка на другой, может быть сложным для обнаружения людьми.

Например, используя 100 переведенных текстов, оценщики-люди смогли идентифицировать только чуть более половины переведенных текстов.

Исследователи отметили:

«Средняя точность составила 53,3% (55,0% для носителей языка и 52,0% для не носителей языка), что было близко к случайному».

Когда статья была опубликована в 2021 году, подход, названный «Сходство текста с двусторонним переводом» (TSRT), превзошел оценщиков-людей и получил более высокие оценки, чем современные детекторы перевода.

Примечательно, что этот метод может определить исходный язык переведенных текстов.

Он также может определить, какой алгоритм перевода выполнил перевод.

Они сообщили:

«Результаты оценки показывают, что TSRT превосходит другие методы с точностью до 90,2%.

Более того, TSRT также может определить переводчика оригинала и язык перевода с точностью 93,3% и 85,6% соответственно».

Неясно, может ли Google обнаруживать переведенный контент и пытается ли Google вообще обнаруживать переведенный контент.

Но мы знаем, что технология для его обнаружения существует. Технология может обнаруживать переведенный контент лучше, чем люди, и определять, какой алгоритм перевода выполнил перевод.

Если того факта, что это противоречит Руководству для веб-мастеров и может иметь негативные последствия для пользователей, недостаточно, чтобы мотивировать редактирование контента с машинным переводом, то, возможно, возможность то, что Google анализирует качество контента для машинного перевода, может быть причиной для всесторонней проверки такого контента.


Цитата

Послушайте видеовстречу Google Office Hours на отметке 17:50.

Избранное изображение Shutterstock/g_tech


Подборка статей по SEO оптимизации сайта. Выбора стратегии продвижения. Продвижение сайта в поисковых системах и социальных сетях. Обучение востребованным профессиям в сфере IT. Настройка рекламных кампаний в интернет. Маркетинг. Анализ рынка. Полезные секреты проведения рекламных кампаний. Все для PR — менеджера.

Информация для Вас была полезна?
0
0
0
0
0
0
0

Похожие статьи

Кнопка «Наверх»