Как работает тест словарного запаса MiniLex
Двухэтапный Yes/No-тест с поправкой на угадывание по методологии LexTALE (Lemhöfer & Broersma, 2012).
Зачем нужен ещё один тест
Большинство тестов словарного запаса в интернете дают завышенные результаты, потому что показывают список слов и спрашивают «какие из них вы знаете?». Человек ставит галочки рядом со словами, которые «выглядят знакомо» — а это очень разные вещи. Культовый testyourvocab.com работал по этому принципу с 2011 по 2023 год; академические рецензенты оценивают его завышение в 30–50%. Мы добавили второй этап, который убирает завышение.
Этап 1. Чек-лист
40 английских слов из разных частотных диапазонов — от самых распространённых (the, water, computer) до редких (mahogany, sanctuary, philosopher). Учащийся отмечает те, чьё значение может объяснить или перевести. Это даёт предварительную оценку — примерный размер словарного запаса.
Этап 2. Yes/No с псевдословами
На втором экране — 60 элементов: 40 реальных английских слов (отобраны адаптивно под результат первого этапа) и 20 псевдослов — придуманных слов, построенных по правилам английской фонетики, но не существующих в языке (например: platery, scrunner, flontish, mensible).
Логика: если человек отмечает «знаю» рядом с flontish, часть его «знаю» — это блеф или самообман. Мы измеряем долю таких ложных срабатываний и корректируем итоговую оценку.
Формула
Итоговая оценка = (доля правильно узнанных реальных слов − доля «узнанных» псевдослов) × размер тестируемой полосы.
Источники слов
Реальные слова — из открытого Google Trillion Word Corpus, после валидации в en_US/en_GB словарях, лемматизации и удаления аббревиатур. В итоге 10 400 чистых лемм, разбитых на 11 частотных полос по 1000 слов. Псевдослова — собственного производства по методологии LexTALE: отсутствуют в словарях, не являются ошибкой в одну букву от реального слова, соответствуют правилам английской фонетики.
Маппинг на CEFR (Milton, 2010)
- <500 слов — Pre-A1
- 500–1000 — A1
- 1000–2000 — A2
- 2000–3250 — B1
- 3250–4500 — B2
- 4500–6000 — C1
- 6000–8000 — C2
- 8000+ — образованный носитель (15–20 тысяч)
Это не сертификация CEFR. Тест даёт ориентировочный диапазон, не официальную оценку.
Что результат измеряет и не измеряет
Тест измеряет пассивный словарь — слова, узнаваемые при чтении. Активный словарь обычно в 2–3 раза меньше. Тест не измеряет грамматику, произношение, способность говорить, понимание идиом и культурного контекста.
Точность
Двухэтапная архитектура с поправкой на псевдослова даёт оценку в пределах ±15% от истинного размера пассивного словаря для большинства учеников (по данным валидации LexTALE). Достаточно для CEFR-полосы, но не для тонкой градации внутри уровня.
Академические источники
- Meara, P. M., & Buxton, B. (1987). An alternative to multiple choice vocabulary tests. Language Testing, 4(2), 142–154.
- Lemhöfer, K., & Broersma, M. (2012). Introducing LexTALE. Behavior Research Methods, 44(2), 325–343.
- Nation, I. S. P. (2006). How large a vocabulary is needed for reading and listening? Canadian Modern Language Review, 63(1), 59–82.
- Milton, J. (2010). The development of vocabulary breadth across the CEFR levels.
- Brysbaert, M., et al. (2016). How many words do we know? Frontiers in Psychology, 7, 1116.
- Beeckmans, R., et al. (2001). Examining the Yes/No vocabulary test. Language Testing, 18(3), 235–274.
Пройти тест — бесплатно, без регистрации.