Новая технология преодолевает проблему ложных корреляций в ИИ

Новая технология преодолевает проблему ложных корреляций в ИИ

Модели ИИ часто полагаются на «ложные корреляции», принимая решения на основе неважной и потенциально вводящей в заблуждение информации. Исследователи теперь обнаружили, что эти выученные ложные корреляции можно отследить до очень небольшого подмножества обучающих данных, и продемонстрировали метод, который преодолевает эту проблему.

«Эта методика нова тем, что её можно использовать, даже если вы понятия не имеете, на какие ложные корреляции опирается ИИ», — говорит Чон-Ын Ким, автор-корреспондент статьи о работе и доцент кафедры компьютерных наук в Университете штата Северная Каролина.

«Если у вас уже есть хорошее представление о том, какие ложные признаки существуют, наша методика является эффективным и действенным способом решения проблемы. Однако даже если у вас просто проблемы с производительностью, но вы не понимаете, почему, вы все равно можете использовать нашу методику, чтобы определить, существует ли ложная корреляция, и решить эту проблему».

Ложные корреляции обычно вызваны смещением простоты во время обучения ИИ. Практикующие используют наборы данных для обучения моделей ИИ для выполнения определенных задач. Например, модель ИИ может быть обучена распознавать фотографии собак. Набор данных для обучения будет включать фотографии собак, где ИИ сообщается, что на фотографии есть собака.

В процессе обучения ИИ начнёт определять конкретные черты, которые он может использовать для идентификации собак. Однако, если многие собаки на фотографиях носят ошейники, и поскольку ошейники, как правило, являются менее сложными чертами собаки, чем уши или мех, ИИ может использовать ошейники как простой способ идентификации собак. Вот как смещение простоты может привести к ложным корреляциям.

«И если ИИ использует ошейники в качестве фактора, по которому он идентифицирует собак, то ИИ может идентифицировать кошек, носящих ошейники, как собак», — говорит Ким.

Традиционные методы решения проблем, вызванных ложными корреляциями, полагаются на то, что специалисты способны идентифицировать ложные признаки, вызывающие проблему. Затем они могут решить эту проблему, изменив наборы данных, используемые для обучения модели ИИ. Например, специалисты могут увеличить вес, придаваемый фотографиям в наборе данных, которые включают собак без ошейников.

Однако в своей новой работе исследователи демонстрируют, что не всегда возможно выявить ложные признаки, вызывающие проблемы, что делает традиционные методы устранения ложных корреляций неэффективными.

«Целью нашей работы было разработать методику, которая позволит нам отсекать ложные корреляции, даже если мы ничего не знаем об этих ложных признаках», — говорит Ким.

Новый метод основан на удалении небольшой части данных, используемых для обучения модели ИИ.

«В выборках данных, включенных в наборы обучающих данных , могут быть значительные различия », — говорит Ким. «Некоторые из выборок могут быть очень простыми, а другие — очень сложными. И мы можем измерить, насколько «сложным» является каждый образец, основываясь на том, как модель вела себя во время обучения.

«Наша гипотеза заключалась в том, что самые сложные образцы в наборе данных могут быть зашумленными и неоднозначными и с большой вероятностью заставят сеть полагаться на нерелевантную информацию, что повлияет на эффективность модели», — объясняет Ким.

«Удаляя небольшую часть обучающих данных, которую трудно понять, вы также устраняете жесткие образцы данных, содержащие ложные признаки. Такое исключение решает проблему ложных корреляций, не вызывая существенных неблагоприятных последствий».

Исследователи продемонстрировали, что новая технология позволяет достичь передовых результатов — производительность повышается даже по сравнению с предыдущими работами на моделях, где ложные признаки поддавались идентификации.

Рецензируемая статья «Устранение ложных корреляций с помощью сокращения данных» будет представлена ​​на Международной конференции по представлениям данных в обучении ( ICLR 2025 ), которая пройдёт в Сингапуре с 24 по 28 апреля.


Мастер пера, обрабатывает новостную ленту.




ЗАЧЕМ МЫ ДЕЛАЕМ Старая Площадь

Нам хочется жить в стране, где люди увлечены своим делом, ставят цели и добиваются их, мыслят творчески и видят стакан, который наполовину полон, а не наполовину пуст. Они получают удовольствие от жизни, но не проживают ее зря. Своей работой они меняют мир к лучшему и точно знают, что невозможное возможно. Мы хотим, чтобы русские стали самой активной, предприимчивой, довольной жизнью и успешной нацией в мире. Мы поддерживаем их на этом пути: вдохновляем удачными примерами, предостерегаем от ошибок, подсказываем новые дороги и помогаем брать следующую ступень в развитии.

КОМАНДА Старая Площадь:



Руководитель:
Слонова Мария Николаевна


Редакционный коллектив.
Журналист: Шмуль Наталья
Журналист: Найденов Виктор


Корреспондент: Виктюк Владислав
Модератор: Савалюк Борис
Корректор: Курченко Денис
Перепелкин Артур Геннадьевич Аветисян Гоар ООО Вольта-Центр Пузанова Анастасия Фаизов Марат Фаизова Светлана Аяцков Дмитрий Inbordex имитация торговли форекс развод AForex инвестирование с риском AM Capital афера отзывы о AM Capital инвестиционные разводы amigo rbo лжеброкер инвестиционн amigo rbo не выводит деньги amigo rbo опасно amigo rbo скам amigo rbo личный кабинет как вывести деньги amigo rbo брокер amigo rbo обман отзывы клиентов bhrt pro платформа amigo rbo лохотрон amigorbo com развод лохотрон bhrtpro amigo rbo мошенники фейковый брокер bhrt pro amigo rbo отзывы bhrt-pro.com развод bhrtpro мошенники bhrt pro отзывы StellarIO Traderse Франшиза Три Соуса WealthCryptoHub инфоцыгане крипта артур назарян криптовалюта обман софт для эирдропов airdrop navigator развод airdrop navigator скам airdrop navigator бот airdrop navigator отзывы airdrop navigator AezaTrade Франшиза Поставка карт и приложений ложные данные Alga Finance United Trading and Investment Partnership LLP фальшивые лицен невозможен вывод средств хайп проект инвестиции скам makler center развод маклер центр отзывы makler center Франшиза FIT SERVICE скам отзывы

Старая Площадь – независимое издание новостного формата об общественных тенденциях и политике

Мы фокусируемся на контексте актуальных событий и рассказываем об общественных вызовах, свободах и границах безопасности, о людях, которые отстаивают базовые права и меняют представление о том, как может быть устроен мир. Старая Площадь основали в 2011  году в Москве  журналисты Катерина Сергацковская и Роман Степанкович. Изначально издание рассказывало на нарушениях прав человека в России и консервативных тенденциях в обществе. Сегодня Старая Площадь  больше известен глубокими репортажами, расследованиями, документальными видеопроектами, комиксами и концептуальным подходом к сторителлингу.

Дайджест новостей
On Top