Учитывая ввод строки, состоящей из любого сообщения из чата нашего сайта, взятого из списка, описанного и связанного ниже, выведите либо истинное, либо ложное значение, пытаясь предсказать, было ли это сообщение помечено звездочкой или нет, в 50 байтах или меньше.
Вы можете использовать любые достоверные или ложные значения , но они должны быть идентичны (т. Е. Должно быть только два возможных выхода: один достоверный и один ложный). Входные данные будут предоставлены в виде необработанного HTML-кода с удаленными символами новой строки, и он может содержать не-ASCII символы Unicode. Если вам требуется что-то, кроме UTF-8, укажите это в своем ответе.
Победившим представителем этого задания будет тот, который правильно прогнозирует наибольший процент сообщений чата из списка, указанного ниже. Если два заданных представления имеют одинаковую норму успеха, более короткое представление выиграет.
Пожалуйста, предоставьте инструкции для запуска вашего кода на всем наборе сообщений и правильного расчета процента. В идеале это должен быть небольшой пример кода (не считая ваших 50 байтов), который проходит через положительные тестовые примеры и выводит, сколько из них ваш код получил правильно, а затем делает то же самое для отрицательных тестовых случаев. (Общая оценка может быть рассчитана вручную с помощью (correctPositive + correctNegative) / totalMessages
.)
Чтобы ваш код был достаточно тестируемым, он должен завершиться за 5 минут или меньше для всего списка сообщений чата на разумном современном оборудовании.
Полный список сообщений чата можно найти здесь , и он состоит из 1000 последних помеченных сообщений в качестве достоверных тестовых случаев и 1000 последних не помеченных сообщений в качестве ложных тестовых случаев. Обратите внимание, что в сущности есть два файла; прокрутите примерно на полпути вниз, чтобы найти сообщения без звезд.
Don'?t star
\^
O2