Зачем нужен ещё один тест словарного запаса?

Большинство тестов в интернете завышают результаты, потому что просят отметить «знакомые» слова. Мы взяли честную идею Yes/No-теста и добавили псевдослова — придуманные несуществующие слова. Это убирает завышение на 30–50%, типичное для testyourvocab.

Из чего состоит тест?

Этап 1 — чек-лист из 40 английских слов разной частоты. Этап 2 — Yes/No с 60 элементами: 40 реальных слов и 20 псевдослов вроде flontish, mensible, scrunner. Тест адаптивно подбирает диапазон под ваш Stage 1.

Как считается итоговая оценка?

Итоговая оценка = (доля правильно узнанных реальных слов − доля «узнанных» псевдослов) × размер тестируемой полосы. Чем больше псевдослов отмечено как знакомые — тем сильнее снижается финальная цифра.

Откуда берутся слова?

Реальные слова — из частотного корпуса Google Trillion Word Corpus, после валидации в en_US и en_GB словарях, лемматизации и удаления аббревиатур. Получилось 10 400 чистых лемм в 11 частотных полосах. Псевдослова собственного производства по методологии LexTALE (Lemhöfer & Broersma, 2012).

Что показывает результат?

Тест измеряет пассивный словарь — слова, которые вы узнаёте при чтении. Это база для понимания текстов, фильмов и устной речи. Активный словарь обычно в 2–3 раза меньше пассивного.

Что результат НЕ измеряет?

Тест не измеряет грамматику, произношение, способность говорить и понимание идиом / культурного контекста. Это одна из составляющих владения языком, но не единственная.

Как соотносится с уровнями CEFR?

Маппинг (Milton, 2010): <500 слов — Pre-A1; 500–1000 — A1; 1000–2000 — A2; 2000–3250 — B1; 3250–4500 — B2; 4500–6000 — C1; 6000–8000 — C2; 8000+ — образованный носитель (15–20 тысяч). Это не сертификация CEFR, а ориентировочный диапазон.

Тест бесплатный? Нужна регистрация?

Тест полностью бесплатный и не требует регистрации, чтобы увидеть результат. Email нужен только если хотите сохранить детальный отчёт по частотным диапазонам и получать новости проекта.

Как работает тест словарного запаса MiniLex

Q: Какая точность теста?

Двухэтапная архитектура с поправкой на псевдослова даёт оценку в пределах ±15% от истинного размера пассивного словаря для большинства учеников (по данным валидации LexTALE). Этого достаточно для CEFR-полосы (A1-C2), но не для тонкой градации внутри уровня.

Q: Тест бесплатный? Нужна регистрация?

Тест полностью бесплатный и не требует регистрации, чтобы увидеть результат. Email нужен только если хотите сохранить детальный отчёт по частотным диапазонам и получать новости проекта.

Двухэтапный Yes/No-тест с поправкой на угадывание по методологии LexTALE (Lemhöfer & Broersma, 2012).

Зачем нужен ещё один тест

Большинство тестов словарного запаса в интернете дают завышенные результаты, потому что показывают список слов и спрашивают «какие из них вы знаете?». Человек ставит галочки рядом со словами, которые «выглядят знакомо» — а это очень разные вещи. Культовый testyourvocab.com работал по этому принципу с 2011 по 2023 год; академические рецензенты оценивают его завышение в 30–50%. Мы добавили второй этап, который убирает завышение.

Этап 1. Чек-лист

40 английских слов из разных частотных диапазонов — от самых распространённых (the, water, computer) до редких (mahogany, sanctuary, philosopher). Учащийся отмечает те, чьё значение может объяснить или перевести. Это даёт предварительную оценку — примерный размер словарного запаса.

Этап 2. Yes/No с псевдословами

На втором экране — 60 элементов: 40 реальных английских слов (отобраны адаптивно под результат первого этапа) и 20 псевдослов — придуманных слов, построенных по правилам английской фонетики, но не существующих в языке (например: platery, scrunner, flontish, mensible).

Логика: если человек отмечает «знаю» рядом с flontish, часть его «знаю» — это блеф или самообман. Мы измеряем долю таких ложных срабатываний и корректируем итоговую оценку.

Формула

Итоговая оценка = (доля правильно узнанных реальных слов − доля «узнанных» псевдослов) × размер тестируемой полосы.

Источники слов

Реальные слова — из открытого Google Trillion Word Corpus, после валидации в en_US/en_GB словарях, лемматизации и удаления аббревиатур. В итоге 10 400 чистых лемм, разбитых на 11 частотных полос по 1000 слов. Псевдослова — собственного производства по методологии LexTALE: отсутствуют в словарях, не являются ошибкой в одну букву от реального слова, соответствуют правилам английской фонетики.

Маппинг на CEFR (Milton, 2010)

<500 слов — Pre-A1
500–1000 — A1
1000–2000 — A2
2000–3250 — B1
3250–4500 — B2
4500–6000 — C1
6000–8000 — C2
8000+ — образованный носитель (15–20 тысяч)

Это не сертификация CEFR. Тест даёт ориентировочный диапазон, не официальную оценку.

Что результат измеряет и не измеряет

Тест измеряет пассивный словарь — слова, узнаваемые при чтении. Активный словарь обычно в 2–3 раза меньше. Тест не измеряет грамматику, произношение, способность говорить, понимание идиом и культурного контекста.

Точность

Двухэтапная архитектура с поправкой на псевдослова даёт оценку в пределах ±15% от истинного размера пассивного словаря для большинства учеников (по данным валидации LexTALE). Достаточно для CEFR-полосы, но не для тонкой градации внутри уровня.

Академические источники

Meara, P. M., & Buxton, B. (1987). An alternative to multiple choice vocabulary tests. Language Testing, 4(2), 142–154.
Lemhöfer, K., & Broersma, M. (2012). Introducing LexTALE. Behavior Research Methods, 44(2), 325–343.
Nation, I. S. P. (2006). How large a vocabulary is needed for reading and listening? Canadian Modern Language Review, 63(1), 59–82.
Milton, J. (2010). The development of vocabulary breadth across the CEFR levels.
Brysbaert, M., et al. (2016). How many words do we know? Frontiers in Psychology, 7, 1116.
Beeckmans, R., et al. (2001). Examining the Yes/No vocabulary test. Language Testing, 18(3), 235–274.

Пройти тест — бесплатно, без регистрации.