Coffee-test для искусственного интеллекта предлагается заменить на изящный Blue Bunny test (BB-test)
BB-test https://t.me/mifofagos/1048 проводится с помощью минимально перенастроенного детского аттракциона Claw machine (мини-мостовой кран с захватом на тросе внутри прозрачного ящика, на дне которого лежат мягкие игрушки.

В типичной Claw machine есть куча ограничений (чтобы задача не была слишком простой), но в этом тестовом варианте - никаких ограничений. Можно двигать захват сколько угодно раз, можно захватывать и перекладывать игрушки как угодно. В ящике более, чем достаточно места для перекладывания игрушек.
На дне ящика лежит куча мягких игрушек, среди которых закопан синий заяц (Blue Bunny), так что в начале игры его не видно… А может, он не закопан. Может, его там нет.
...Оператором кран-машины будет тестируемый искусственный интеллект, снабженный стандартной системой компьютерного зрения с распознаванием образов.
Тестовая задача: раскопать синего зайца и извлечь его через окно выдачи, или убедиться, что его нет в ящике, и сообщить об этом.
Отличие от кофейного теста Стива Возняка в том, что никакие отговорки и запутывания не получатся. Тест предельно простой и понятный по условиям и по способу реализации тестирования.
Интересно, кто-нибудь из разработчиков AI примет вызов?
...Такие дела...

В типичной Claw machine есть куча ограничений (чтобы задача не была слишком простой), но в этом тестовом варианте - никаких ограничений. Можно двигать захват сколько угодно раз, можно захватывать и перекладывать игрушки как угодно. В ящике более, чем достаточно места для перекладывания игрушек.
На дне ящика лежит куча мягких игрушек, среди которых закопан синий заяц (Blue Bunny), так что в начале игры его не видно… А может, он не закопан. Может, его там нет.
...Оператором кран-машины будет тестируемый искусственный интеллект, снабженный стандартной системой компьютерного зрения с распознаванием образов.
Тестовая задача: раскопать синего зайца и извлечь его через окно выдачи, или убедиться, что его нет в ящике, и сообщить об этом.
Отличие от кофейного теста Стива Возняка в том, что никакие отговорки и запутывания не получатся. Тест предельно простой и понятный по условиям и по способу реализации тестирования.
Интересно, кто-нибудь из разработчиков AI примет вызов?
...Такие дела...
Published on October 08, 2025 07:30
No comments have been added yet.
Александр Александрович Розов's Blog
- Александр Александрович Розов's profile
- 13 followers
Александр Александрович Розов isn't a Goodreads Author
(yet),
but they
do have a blog,
so here are some recent posts imported from
their feed.

