Я работаю над приложением, чтобы помочь людям выучить английский как второй язык. Я подтвердил, что предложения помогают в изучении языка, предоставляя дополнительный контекст. Я сделал это, проведя небольшое исследование в классе из 60 учеников.
Я добыл более ста тысяч предложений из Википедии для различных английских слов (включая 800 слов Барронса и 1000 самых распространенных английских слов)
Полные данные доступны на https://buildmyvocab.in
Чтобы сохранить качество контента, я отфильтровал предложения длиной более 160 символов, поскольку их было трудно понять.
В качестве следующего шага я хочу иметь возможность автоматизировать процесс сортировки этого контента в порядке простоты понимания. Я сам не являюсь носителем английского языка. Я хочу знать, какие функции я могу использовать, чтобы отделить простые предложения от сложных.
Кроме того, вы думаете, что это возможно?