Стоит ли доверять детектору ИИ?

Генеративный ИИ становится основой для большего количества контента, заставляя многих сомневаться в надежности своего детектора ИИ.

В ответ на это было проведено несколько исследований эффективности инструментов обнаружения ИИ для различения контента, созданного человеком, и контента, созданного ИИ.

Мы разберем эти исследования, чтобы помочь вам узнать больше о том, как работают детекторы ИИ, показать вам пример детекторов ИИ в действии и помочь вам решить, можно ли доверять инструментам или исследованиям.

Предвзяты ли детекторы ИИ?

Исследователи обнаружили, что детекторы контента ИИ, предназначенные для обнаружения контента, созданного GPT, могут иметь значительную предвзятость в отношении авторов, не являющихся носителями английского языка.

Исследование показало, что эти детекторы, предназначенные для различения контента, созданного искусственным интеллектом, и контента, созданного человеком, постоянно ошибочно классифицируют образцы письма на неродном английском языке как созданные искусственным интеллектом, в то же время точно идентифицируя образцы письма на родном английском языке.

Используя образцы письма от носителей и не носителей английского языка, исследователи обнаружили, что детекторы ошибочно классифицировали более половины последних образцов как сгенерированные ИИ.

Интересно, что исследование также показало, что простые стратегии подсказок, такие как «Поднимите предоставленный текст, используя литературный язык», может смягчить это смещение и эффективно обойти детекторы GPT.

Скриншот с сайта Arxiv.org, июль 2023 г.

Полученные данные свидетельствуют о том, что детекторы GPT могут непреднамеренно наказывать авторов с ограниченными языковыми выражениями, что подчеркивает необходимость повышенного внимания к справедливости и надежности этих инструментов.

Это может иметь серьезные последствия, особенно в оценочной или образовательной среде, где носители английского языка могут быть непреднамеренно оштрафованы или исключены из глобального дискурса. В противном случае это привело бы к «несправедливым последствиям и риску усугубления существующих предубеждений».

Исследователи также подчеркивают необходимость дальнейших исследований по устранению этих предубеждений и совершенствованию существующих методов обнаружения, чтобы обеспечить более справедливый и безопасный цифровой ландшафт для всех пользователей.

Сможете ли вы победить детектор ИИ?

В отдельном исследовании текста, сгенерированного ИИ, исследователи документируют оптимизацию контекстных примеров на основе замены (SICO), позволяющую крупным языковым моделям (LLM), таким как ChatGPT, избегать обнаружения детекторами текста, сгенерированными ИИ.

В исследовании использовались три задачи для моделирования сценариев использования LLM в реальной жизни, где критически важно обнаружение сгенерированного ИИ текста, включая академические эссе, открытые вопросы и ответы, а также бизнес-обзоры.

Он также включал тестирование SICO на шести репрезентативных детекторах, включая модели на основе обучения, статистические методы и API-интерфейсы, которые неизменно превосходили другие методы для всех детекторов и наборов данных.

Исследователи обнаружили, что SICO была эффективна во всех протестированных сценариях использования. Во многих случаях текст, сгенерированный SICO, часто был неотличим от текста, написанного человеком.

Однако они также подчеркнули потенциальное неправильное использование этой технологии. Поскольку SICO может помочь сгенерированному ИИ тексту избежать обнаружения, злонамеренные субъекты могут также использовать его для создания вводящей в заблуждение или ложной информации, которая кажется написанной человеком.

Оба исследования указывают на скорость, с которой развитие генеративного ИИ опережает разработку детекторов текста ИИ, а второе подчеркивает необходимость более сложной технологии обнаружения.

Эти исследователи предполагают, что интеграция SICO на этапе обучения детекторов ИИ может повысить их надежность и что основная концепция SICO может быть применена к различным задачам генерации текста, открывая новые возможности для будущих исследований в области генерации текста и обучения в контексте.

Склоняются ли детекторы ИИ к человеческой классификации?

Исследователи третьего исследования скомпилировали предыдущие исследования надежности детекторов ИИ, а затем их данные, опубликовав несколько выводов об этих инструментах.

Айдин и Караарслан (2022) обнаружили, что iThenticate, популярный инструмент обнаружения плагиата, обнаружил высокие показатели совпадения с текстом, перефразированным ChatGPT.
Ван и др. (2023) обнаружили, что код, сгенерированный ИИ, сложнее обнаружить, чем контент на естественном языке. Более того, некоторые инструменты демонстрировали предвзятость, склоняясь к определению текста как созданного ИИ или написанного человеком.
Пегораро и др. (2023) обнаружили, что обнаружение текста, сгенерированного ChatGPT, является очень сложной задачей, а самый эффективный инструмент обеспечивает показатель успеха менее 50%.
Ван Ойен (2023) показал, что общая точность инструментов при обнаружении текста, сгенерированного ИИ, составляет всего около 28%, а лучший инструмент достигает точности всего 50%. И наоборот, эти инструменты оказались более эффективными (точность около 83%) при обнаружении контента, написанного человеком.
Андерсон и др. (2023) заметили, что перефразирование заметно снижает эффективность выходного детектора GPT-2.

Используя 14 инструментов обнаружения текста, созданных искусственным интеллектом, исследователи создали несколько десятков тестовых случаев в разных категориях, в том числе:

Текст, написанный человеком.
Переведенный текст.
Текст, сгенерированный ИИ.
Текст, сгенерированный искусственным интеллектом, с правками человека.
Текст, сгенерированный ИИ, с перефразированием ИИ.

Эти тесты оценивались с использованием следующего:

Скриншот с сайта Arxiv.org, июль 2023 г.

Turnitin стал самым точным инструментом во всех подходах, за ним последовали Compilatio и GPT-2 Output Detector.

Тем не менее, большинство протестированных инструментов продемонстрировали предвзятость в отношении точной классификации текста, написанного человеком, по сравнению с текстом, созданным или измененным ИИ.

Хотя этот результат желателен в академическом контексте, исследование и другие исследования выявили риск ложных обвинений и необнаруженных случаев. Ложные срабатывания были минимальными в большинстве инструментов, за исключением GPT Zero, который показал высокий уровень.

Необнаруженные случаи вызывали озабоченность, особенно в отношении текстов, сгенерированных ИИ, которые подвергались редактированию человеком или машинному перефразированию. Большинство инструментов изо всех сил пытались обнаружить такой контент, создавая потенциальную угрозу академической честности и справедливости среди студентов.

Оценка также выявила технические трудности с инструментами.

Некоторые сталкивались с ошибками сервера или имели ограничения на прием определенных типов входных данных, таких как компьютерный код. Другие столкнулись с проблемами вычислений, а обработка результатов в некоторых инструментах оказалась сложной.

Исследователи предположили, что устранение этих ограничений будет иметь решающее значение для эффективного внедрения инструментов обнаружения текста, созданных ИИ, в образовательных учреждениях, обеспечивая точное обнаружение неправомерных действий при минимизации ложных обвинений и необнаруженных случаев.

Насколько точны эти исследования?

Стоит ли доверять средствам обнаружения ИИ, основанным на результатах этих исследований?

Более важный вопрос может заключаться в том, следует ли вам доверять этим исследованиям инструментов обнаружения ИИ.

Я отправил третье исследование, упомянутое выше, Джонатан Гиллхэм, основатель Originality.ai. У него было несколько очень подробных и проницательных комментариев.

Начнем с того, что Originality.ai не предназначался для сектора образования. Другие протестированные детекторы ИИ, возможно, также не были созданы для этой среды.

Требование для использования в академических кругах состоит в том, что он дает обязательный ответ. Это одна из причин, почему мы прямо сообщаем (в верхней части нашей домашней страницы), что наш инструмент предназначен для цифрового маркетинга, а НЕ для научных кругов.

Возможность оценить несколько статей, представленных одним и тем же автором (не студентом), и сделать обоснованное суждение — это гораздо лучший вариант использования, чем принятие последовательных решений по одной статье, представленной студентом.

Определение контента, созданного ИИ, может варьироваться в зависимости от того, что указывает исследование, и того, что определяет каждый инструмент обнаружения ИИ. Гиллхэм включил следующее в качестве ссылки на различные значения ИИ и контента, созданного человеком.

AI-Generated and Not Edited = AI-Generated text.
Сгенерированный ИИ и отредактированный человеком = текст, сгенерированный ИИ.
Контур ИИ, написанный человеком и сильно отредактированный ИИ = текст, сгенерированный ИИ.
Исследования ИИ и написанное людьми = Оригинально созданное человеком.
Написано человеком и отредактировано с помощью Grammarly = Оригинал создан человеком.
Написано человеком и отредактировано человеком = Оригинал создан человеком.

Некоторые категории в исследовании проверяли текст, переведенный ИИ, ожидая, что он будет классифицирован как человеческий. Например, на странице 10 исследования говорится:

Для второй категории (называемой 02-MT) около 10 000 символов (включая пробелы) были написаны на боснийском, чешском, немецком, латышском, словацком, испанском и шведском языках. Ни один из этих текстов, возможно, не был выставлен в Интернете ранее, как и для 01-Hum. В зависимости от языка для создания тестовых документов на английском языке использовался либо инструмент перевода AI DeepL (3 случая), либо Google Translate (6 случаев).

В течение двухмесячного периода экспериментов некоторые инструменты добились огромных успехов. Гиллхэм включил графическое представление улучшений в течение двух месяцев после обновления версии.

Скриншот с сайта Originality.ai, июль 2023 г.

Дополнительные проблемы с анализом исследования, которые выявил Гиллхэм, включали небольшой размер выборки (54), неправильно классифицированные ответы и включение только двух платных инструментов.

Данные и материалы тестирования должны были быть доступны по URL-адресу, указанному в конце исследования. Запрос данных, сделанный в течение двух недель, остается без ответа.

Что эксперты по ИИ должны были сказать об инструментах обнаружения ИИ

Я запросил сообщество HARO, чтобы узнать, что другие говорят об их опыте работы с детекторами ИИ, что привело к непреднамеренному собственному исследованию.

В какой-то момент я получил пять ответов за две минуты, которые были дублирующими ответами из разных источников, что показалось мне подозрительным.

Я решил использовать Originality.ai для всех ответов HARO, которые я получил по этому запросу. Основываясь на моем личном опыте и ненаучных тестах, этот конкретный инструмент оказался сложным.

Скриншот с сайта Originality.ai, июль 2023 г.

Originality.ai со 100% уверенностью обнаружил, что большинство этих ответов были сгенерированы ИИ.

Единственными ответами HARO, которые в основном исходили от людей, были вводные предложения из одного-двух предложений к потенциальным источникам, в которых я мог бы заинтересоваться.

Эти результаты не стали неожиданностью, потому что для ChatGPT есть расширения Chrome для написания ответов HARO.

Скриншот с Reddit, июль 2023 г.

Что FTC должна была сказать об инструментах обнаружения ИИ

Федеральная торговая комиссия предостерегла компании от преувеличения возможностей инструментов ИИ для обнаружения сгенерированного контента, предупредив, что неточные маркетинговые заявления могут нарушить законы о защите прав потребителей.

Потребителям также посоветовали скептически относиться к заявлениям о том, что инструменты обнаружения ИИ могут надежно идентифицировать весь искусственный контент, поскольку технология имеет ограничения.

FTC заявила, что для обоснования маркетинговых заявлений об инструментах обнаружения ИИ необходима надежная оценка.

Был ли ИИ использован для написания Конституции?

Инструменты обнаружения ИИ попали в заголовки газет, когда пользователи обнаружили, что существует вероятность того, что ИИ написал Конституцию Соединенных Штатов.

Скриншот с сайта Originality.ai, июль 2023 г.

В сообщении на Ars Technica объясняется, почему инструменты обнаружения письма ИИ часто ошибочно идентифицируют такие тексты, как Конституция США, как созданные ИИ.

Скриншот с ZeroGPT, июль 2023 г.

Исторический и формальный язык часто дает низкие оценки «замешательства» и «взрыва», которые они интерпретируют как показатели письма ИИ.

Скриншот из GPTZero, июль 2023 г.

Писатели-люди могут использовать общие фразы и формальные стили, что приводит к одинаковым оценкам.

Это упражнение еще раз подтвердило мнение Федеральной торговой комиссии о том, что потребители должны скептически относиться к оценкам детекторов ИИ.

Сильные стороны и ограничения

Результаты различных исследований подчеркивают сильные и слабые стороны инструментов обнаружения ИИ.

Хотя детекторы ИИ продемонстрировали некоторую точность в обнаружении текста, сгенерированного ИИ, они также продемонстрировали предвзятость, проблемы с удобством использования и уязвимости для методов уклонения.

Но сами исследования могут быть ошибочными, оставляя все для предположений.

Необходимы улучшения для устранения систематических ошибок, повышения надежности и обеспечения точного обнаружения в различных контекстах.

Непрерывные исследования и разработки имеют решающее значение для укрепления доверия к детекторам ИИ и создания более справедливого и безопасного цифрового ландшафта.

Рекомендуемое изображение: Ascannio/Shutterstock

Подборка статей о тонкостях написания контента, подготовки медиа для сайта. Обучение востребованным профессиям в сфере IT. Полезные рекомендации проведения маркетинговых кампаний. Подпишитесь на нас в социальных сетях, что бы не пропустить важное.

Информация для Вас была полезна?

Время чтения: 7 мин.

Предвзяты ли детекторы ИИ?

Сможете ли вы победить детектор ИИ?

Склоняются ли детекторы ИИ к человеческой классификации?

Насколько точны эти исследования?

Что эксперты по ИИ должны были сказать об инструментах обнаружения ИИ

Что FTC должна была сказать об инструментах обнаружения ИИ

Был ли ИИ использован для написания Конституции?

Сильные стороны и ограничения

Специальная подборка для Вас

Законопроект о стейблкоине укрепит доминирование доллара и поможет бороться с уклонением от санкций

8 лучших рекламных платформ на 2024 год

Сравнение 10 лучших инструментов создания контента с использованием искусственного интеллекта

31 лучшая идея для подарков (+ советы, как сделать их успешными)

Как продвинуть молодой сайт: пошаговая инструкция для новичков

Обновление алгоритма Google: куда движется развитие поисковых систем. Мнения экспертов

8 лучших идей лидогенерации от экспертов по маркетингу

Примеры страниц «Свяжитесь с нами»: 44 дизайна для вдохновения

14 экспертных идей для лучшей стратегии местного маркетинга в 2024 году

Приоритизация получения информации = переосмысление того, как мы создаем контент

Потенциал объединения блокчейна, Интернета вещей и искусственного интеллекта

Крупнейшие тенденции, проблемы и стратегии успеха

Продвижение регионального сайта: методы и нюансы

Как продать 29 квартир за семь месяцев с помощью лид-форм в Рекламе ВК. Случай

Почему токенизация активов неизбежна

Специальная подборка для Вас

Предвзяты ли детекторы ИИ?

Сможете ли вы победить детектор ИИ?

Склоняются ли детекторы ИИ к человеческой классификации?

Насколько точны эти исследования?

Что эксперты по ИИ должны были сказать об инструментах обнаружения ИИ

Что FTC должна была сказать об инструментах обнаружения ИИ

Был ли ИИ использован для написания Конституции?

Сильные стороны и ограничения

585*ЗОЛОТОЙ проведет опрос общественного мнения потребительской аудитории

9 лучших практик ретаргетинга в LinkedIn, которые сокращают расходы и повышают конверсию

Похожие статьи

Когда контент-стратегия терпит неудачу? 11 негативных факторов

Как спланировать пост в блоге за 6 простых шагов

Контент-маркетинг для юридических фирм: увеличение охвата и рейтинга

Элементы успешной контент-стратегии

Специальная подборка для Вас