Coffee-test для искусственного интеллекта предлагается заменить на изящный Blue Bunny test (BB-test)

BB-test https://t.me/mifofagos/1048 проводится с помощью минимально перенастроенного детского аттракциона Claw machine (мини-мостовой кран с захватом на тросе внутри прозрачного ящика, на дне которого лежат мягкие игрушки.
1bb.jpg
В типичной Claw machine есть куча ограничений (чтобы задача не была слишком простой), но в этом тестовом варианте - никаких ограничений. Можно двигать захват сколько угодно раз, можно захватывать и перекладывать игрушки как угодно. В ящике более, чем достаточно места для перекладывания игрушек.
На дне ящика лежит куча мягких игрушек, среди которых закопан синий заяц (Blue Bunny), так что в начале игры его не видно… А может, он не закопан. Может, его там нет.
...Оператором кран-машины будет тестируемый искусственный интеллект, снабженный стандартной системой компьютерного зрения с распознаванием образов.
Тестовая задача: раскопать синего зайца и извлечь его через окно выдачи, или убедиться, что его нет в ящике, и сообщить об этом.

Отличие от кофейного теста Стива Возняка в том, что никакие отговорки и запутывания не получатся. Тест предельно простой и понятный по условиям и по способу реализации тестирования.
Интересно, кто-нибудь из разработчиков AI примет вызов?

...Такие дела...
 •  0 comments  •  flag
Share on Twitter
Published on October 08, 2025 07:30
No comments have been added yet.