Вдохновленный найденным orie автоматическим определителем языков я решил запостить в ЖЖ свой «Определитель славянских литературных языков».
Он сделан по образцу биологических определителей. Написан он исключительно из любви к искусству и для прикола, так как люди, интересующиеся славянскими языками, довольно быстро могут научиться опознавать язык сразу, без утомительной процедуры, а прочим же такой определитель вообще не нужен.
Тем не менее, желающие могут ознакомиться. Критика, предложения, указания на ошибки – приветствуются!
Определитель построен по введенному Ламарком дихотомическому принципу. Каждый шаг в определении состоит из двух утверждений: тезиса и противоположного ему антитезиса. Тезисы пронумерованы, антитезисы обозначаются нулем. При определении следует внимательно прочитать как тезис, так и антитезис, выбрать из этих утверждений подходящее, а далее перейти к шагу, номер которого указан. Так надо действовать до тех пор, пока после очередного тезиса (или антитезиса) не будет указано название языка.
Для примера приведем фрагмет определителя для гипотетических животных:
1. Ног шесть > 2
0. Ног семь > 3
2. Крылья красные > Краснокрылый шестиног
0. Крылья синие > Синекрылый шестиног
3. Брюхо узкое > Узкобрюхий семиног
0. Брюхо широкое > Широкобрюхий семиног
Определитель славянских языков должен различать следующие литературные языки: белорусский (две орфографические нормы), болгарский, верхнелужицкий, кашубский, македонский, нижнелужицкий, польский, русский (две орфографические нормы), сербский, словацкий, словенский, украинский, хорватский, чешский. Сербский язык определяется как использующий кириллическую письменность, хорватский – как использующий латинскую, хотя это и несколько упрощенная картина. Определитель не в состоянии отличить боснийский (босанский) от хорватского. При помощи данного определителя, к сожалению, нельзя опознать русинский язык и другие языки, не вошедшие в вышеуказанный список.
При определении желательно иметь текст достаточно большого объема.
1. Письменность на основе кириллического алфавита > 2
0. Письменность на основе латинского алфавита > 9
2. Есть буква i > 3
0. Нет буквы i > 6
3. Есть буква ы > 4
0. Нет буквы ы, а также букв ё, ъ. Есть буквы є, ϊ. Изредка встречается буква Ґ ґ. Сравнительно часто используется апостроф > украинский язык
4. Есть буква ў, букв и, ъ, ѣ (ять) в алфавите нет. Очень часто встречаются сочетания: дж и дз: дзед, адзiн. На письме отражается аканье: галава, палавiна > 5
0. Есть буквы и, ъ, ѣ (ять), изредка – буква v (ижица),буквы ў в алфавите нет. На конце слова после согласных ставится ъ (твердый знак) > русский язык (орфографическая норма до реформы 1918 года)
5. Мягкость звуков з, с, ц, дз в положении их перед мягким согласным обозначается ь: сьнег > белорусский язык (орфографическая норма до реформы 1933 года, тарашкевица)
0. Мягкость з, с, ц, дз в положении их перед мягким согласным на письме не обозначается: снег > белорусский язык (орфографическая норма после реформы 1933 года, наркомовка)
6. Есть буквы Љ љ, Њ њ, Џ џ, S s, J j > 7
0. Нет букв Љ љ, Њ њ, Џ џ, S s, J j > 8
7. Есть буквы Ћ ћ, Ђ ђ. Нет букв ё, й, щ, ъ, ы, ь, э, ю, я > сербский язык
0. Есть буквы Ќ ќ, Ѓ ѓ, нет букв Ћ ћ, Ђ ђ, ё, й, щ, ъ, ы, ь, э, ю, я. После существительных встречается артикль: -от, -то, -та, -те. Очень часто встречается окончание -аа > македонский язык
8. Часто употребляется буква ъ, служащая для обозначения гласного звука. После существительных встречается артикль: -ът, -ят, -та, -то, -те. Нет букв ё, ы, э > болгарский язык
0. Буква ъ используется редко, есть буквы ы, э, факультативно – ё > русский язык
9. Есть буквы Ł ł, Ń ń > 10
0. Букв Ł ł, Ń ń в алфавите нет > 13
10. Есть буква Ż ż > 11
0. Буквы Ż ż в алфавите нет > 12
11. Есть буквы Ć ć, Ś ś, Ź ź, ę, также ą, ó. Отстутствуют буквы ã, é, ë, ô. Нет также букв q, v, x > польский язык
0. Есть буквы ã, é, ë, ô, а также ą, ó. Отстутствуют буквы Ć ć, Ś ś, Ź ź, ę. Нет также букв q, v, x > кашубский язык
12. Есть буквы Ŕ ŕ, Ś ś, Ź ź. Нет буквы Ř ř, буква ó используется только в ряде изданий. В алфавите также имеются ć, č, ě, ł, ń, š, ž > нижнелужицкий язык
0. Нет букв Ŕ ŕ, Ś ś. Буква ź используется только в составе диграфа dź. Есть буквы Ř ř, Ó ó, а также имеются ć, č, ě, ł, ń, š, ž > верхнелужицкий язык
13. Есть буквы Ď ď, Ň ň, Ť ť, Á á, É é, Í í, Ú ú > 14
0. Нет букв Ď ď, Ň ň, Ť ť, Á á, É é, Í í, Ú ú > 15
14. Есть буква Ů ů, есть также буквы Č č, Š š, Ž ž, Ř ř. Нет букв Ľ ľ, Ý ý, Ä ä, Ô ô, а также нет q, w, z. Характерны сочетания согласных типа drž, hrdl, krv, prst, prv, strč > чешский язык
0. Есть буквы Ľ ľ, Ý ý, Ä ä, Ô ô, есть также буквы Č č, Š š, Ž ž, Ř ř. Нет буквы Ů ů, а также нет q, w, x > словацкий язык
15. Есть буква Đ đ. Также есть буквы č, š, ž. Часты сочетания dž, ji, lj, nj. Нет букв q, w, x, y. > хорватский язык
0. Нет буквы Đ đ. Есть буквы č, š, ž. Отсутствуют буквы q, w, x, y. Отличительным признаком может служить сочинительный союз in, которого нет в других славянских языках > словенский язык
- "Определитель славянских литературных языков"
ailoyros
2007-04-07 04:11 pm (local)
Предлагаю краткий вариант:
"пепси-кола" произносится как "пшепши-коуа" - польский. ;)
rousseau
2007-04-07 05:39 pm (local)
svetlost
2007-04-07 04:17 pm (local)
záď - корма,
záda - спина
ze - от, из
zob - зерно, корм для птиц
Не говоря уже о zoo и прочих заимстствованиях
rousseau
2007-04-07 05:37 pm (local)
а q и w в чешском есть?
svetlost
2007-04-07 07:36 pm (local)
hyalma
2007-04-07 04:31 pm (local)
Ну... вообще-то иногда пишут "Qrczę" :-))
rousseau
2007-04-07 05:38 pm (local)
но уточнение про q, v, x я в любом случае внесу
hyalma
2007-04-07 05:41 pm (local)
не стоит
old_fox
2007-04-08 09:11 pm (local)
В литературном польском языке для передачи собственно польских слов q v x не существует.
Re: не стоит
rousseau
2007-04-08 11:58 pm (local)
atsiprašau
chhwe
2007-04-10 01:30 am (local)
old_fox
2007-04-08 08:53 pm (local)
Za bardzo się pan wykoślawiasz z taką polszczyzną.
hyalma
2007-04-08 09:15 pm (local)
A za słówko przepraszam - naprawdę bardzo przepraszam - ale dla filologów (mam na myśli Pana tego blogu) każde porzekadło się przyda.
old_fox
2007-04-07 05:02 pm (local)
rousseau
2007-04-07 05:38 pm (local)
ponochka
2007-04-08 09:31 pm (local)
old_fox
2007-04-08 09:51 pm (local)
ponochka
2007-04-08 10:02 pm (local)
ну а вы какой имели в виду? откуда знаете? сами являетесь носителем?
old_fox
2007-04-08 10:13 pm (local)
tourelle
2007-04-07 05:33 pm (local)
rousseau
2007-04-07 05:39 pm (local)
anna_muradova
2007-04-07 05:50 pm (local)
fortunatus
2007-04-07 06:46 pm (local)
arno1251
2007-04-09 01:40 pm (local)
anatbel
2007-04-07 10:53 pm (local)
Молодец...
vadim_i_z
2007-04-07 11:02 pm (local)
Но в белорусском есть ещё и латинка...
rousseau
2007-04-08 02:59 pm (local)
ramie_
2007-04-07 11:19 pm (local)
orie
2007-04-08 01:37 am (local)
вообще, супер, ты гигант ;-)
kcmamu
2007-04-08 06:33 am (local)
rousseau
2007-04-08 02:59 pm (local)
Ниже анонимный читатель в комментарии привел вариант определителя, который куда полнее охватывает кириллические варианты
(Anonymous)
2007-04-08 09:20 am (local)
(Anonymous)
2007-04-08 09:39 am (local)
rousseau
2007-04-08 02:58 pm (local)
antti_kurjahalb
2007-04-08 07:22 pm (local)
Кстати о птичках - у сербов в настоящее время вполне активно используется латиница. В частности мне подруга из Сербии присылала диски в коробках из под фильмов изданных в Сербии - и все подписаны латиницей.
И второе - не сочти меня сербохорватоконсерватором - но боснийский - все таки диалект хорватского. (Хотя тот же македонский - в Болгарии считают диалектом болгарского).
rousseau
2007-04-08 11:59 pm (local)
О болгарских орфографиях (хотя и это не все)
iad
2007-04-13 03:25 am (local)
elif есть ѭ then
if есть ё, ıe, ıa, ъı then конец XIX в. else начало XX в. fi
elif есть ѣ then
if его много then —1921 г. else 1923–1945 гг. fi
{шибболетом может служить, например, написание двѣ vs. две}
elif есть ѫ, а нет ъ, ь then 1921–1923 гг. (т.наз. орфография [министра] Омарчевского)
elif все слова оканчиваются на ъ или ь (если не на гласный или й)
then личная орфография поэта Пенчо Славейкова (1866–1912)
else 1945 г.—
fi
Re: О болгарских орфографиях (хотя и это не все)
(Anonymous)
2007-04-17 12:56 pm (local)
Re: О болгарских орфографиях (хотя и это не все)
kcmamu
2007-04-17 12:59 pm (local)
Re: О болгарских орфографиях (хотя и это не все)
iad
2007-04-17 01:40 pm (local)
spamsink
2007-06-20 12:02 pm (local)
alejandro_sh
2009-09-05 07:01 pm (local)
Чешский: (Ě)ě, Řř, (Ů)ů (которая, вообще, ни в каком другом алфавите не представлена).
Словацкий: (Ä)ä, (Ĺ)ĺ, Ľľ, (Ŕ)ŕ, (Ô)ô.
Скобки означают, что данный символ не может стоять в начале слова.
Оба языка применяют литеры: Čč, Šš, Žž, Ňň, Ďď, Ťť, а также гласные со знаком долготы: á, é, í, ó, ú, ý - правда, в чешском ó встречается редко - лишь в заимствованиях (fórum), а литера ú практически всегда стоит только в начале слова (в словацком этих ограничений нет).
Оба алфавита содержат литеры q, w, x, но применяют их лишь в иноязычных словах (гл. обр., именах собственных); однако, буква х встречается также и в уже усвоенных заимствованиях: text, paradox, existovat (!)