Papers by Mikhail Zhivlov
Journal of Language Relationship / Вопросы языкового родства, 2024
The article reviews the history of Hokan studies, from the formulation of the Hokan hypothesis by... more The article reviews the history of Hokan studies, from the formulation of the Hokan hypothesis by Dixon & Kroeber in 1912-1913 to the present day. Despite more than a hundred years of research, there is yet no consensus on the validity of the Hokan hypothesis. The article argues that one of the reasons for this is the fact that many attempts to compare Hokan languages used a non-standard methodology, in which the study stops at listing the observed sound correspondences, instead of the classical comparative method, which requires a search for complementary distributions and a comprehensive reconstruction of protophonology.
Journal of Language Relationship / Вопросы языкового родства, 2023
This paper offers a number of additions and corrections to the corpus of etymologies published in... more This paper offers a number of additions and corrections to the corpus of etymologies published in Irina Nikolaeva’s A Historical Dictionary of Yukaghir (De Gruyter, 2006). The focus of the paper is on internal Yukaghir etymology rather than on search for loanwords or long-range cognates.
Journal of Historical Linguistics, 2023
Relationships between universally recognized language families represent a hotly debated topic in... more Relationships between universally recognized language families represent a hotly debated topic in historical linguistics, and the same is true for correlation between signals of genetic and linguistic relatedness. We developed a weighted permutation test which represents the classical permutation tests with weights introduced for individual Swadesh concepts according to their typological stability. Further, the obtained values were calibrated on a negative control group to override non-uniform distribution of phonemes within the Swadesh wordlist. We applied the calibrated permutation test to the basic vocabularies of nine languages and reconstructed proto-languages to show that three groups of circumpolar language families in the Northern Hemisphere show evidence of relationship through common descent or borrowing in the basic vocabulary: [Chukotko-Kamchatkan, Nivkh]; [Yukaghir, Samoyedic]; and [Yeniseian, Na-Dene, Burushaski]. The former two pairs showed the most significant signals of language relationship. Our findings further support some hypotheses on long-distance language relationships previously put forward based on linguistic methods but lacking universal acceptance.
Journal of Language Relationship / Вопросы языкового родства, 2022
This paper presents a number of additions and corrections to the corpus of etymologies published ... more This paper presents a number of additions and corrections to the corpus of etymologies published in Irina Nikolaeva's "A Historical Dictionary of Yukaghir" (De Gruyter, 2006). The focus of the paper is on internal Yukaghir etymology rather than on search for loanwords or long-range cognates.
International Journal of Eurasian Linguistics, 2022
This paper analyses a number of morphophonological alternations in the Yukaghir languages with th... more This paper analyses a number of morphophonological alternations in the Yukaghir languages with the aim of the internal reconstruction of pre-Proto-Yukaghir. The main focus is on the simplification of complex consonant clusters arising on morphological boundaries between consonant-final root allomorphs and derivational suffixes. The paper also contains a new reconstruction of Proto-Yukaghir and pre-Proto- Yukaghir consonantism.
Linguistics, 2021
https://doi.org/10.1515/ling-2020-0060 In this paper, we present a new reconstruction of Indo-Eur... more https://doi.org/10.1515/ling-2020-0060 In this paper, we present a new reconstruction of Indo-European phylogeny based on thirteen 110-item basic wordlists for protolanguages of IE subgroups (Proto-Germanic, Proto-Slavic, etc.) or ancient languages of the corresponding subgroups (Hittite, Ancient Greek, etc.). We apply reasonably formal techniques of linguistic data collection and post-processing (onomasiological reconstruction, derivational drift elimination, homoplastic optimization) that have been recently proposed or specially developed for the present study. We use sequential phylogenetic workflow and obtain a consensus tree based on several algorithms (Bayesian inference, maximum parsimony, neighbor joining; without topological constraints applied). The resulting tree topology and datings are entirely compatible with established expert views. Our main finding is the multifurcation of the Inner IE clade into four branches ca. 3357-2162 BC: (1) Greek-Armenian, (2) Albanian, (3) Italic-Germanic-Celtic, (4) Balto-Slavic-Indo-Iranian. The proposed radiation scenario may be reconciled with diverse opinions on Inner IE branchings previously expressed by Indo-Europeanists.
Как предположил Е. А. Хелимский, парадигматические чередования корневых гласных в хантыйском – аб... more Как предположил Е. А. Хелимский, парадигматические чередования корневых гласных в хантыйском – аблаут – являются результатом воздействия на первый слог гласных второго слога, впоследствии частично выпавших. Хелимский предложил внутреннюю реконструкцию этих гласных – триггеров аблаута *I, *II, *U и *AA, но их уральские истоки остаются неясными. Цель данной статьи – установить уральское происхождение одного из этих триггеров – морфонемы *I. Убедительные внешние параллели имеются для двух аффиксов, содержащих эту морфонему. Аффикс локативных прилагательных *-I имеет соответствия в мансийском, пермских и самодийских. На прауральском уровне он может быть реконструирован как *-ji. Коаффикс посессивных форм терминов родства *-I- обнаруживает параллели в марийском, удмуртском, венгерском и селькупском. Для прауральского можно предположить существование особой серии посессивных окончаний терминов родства, отличавшихся от обычных посессивных окончаний наличием коаффикса *-j- в формах 1 и 2 лица.
Этнография / Etnografia, 2019
The article analyzes an areal polysemy ‘earth/year’ in the languages of North America. The distri... more The article analyzes an areal polysemy ‘earth/year’ in the languages of North America. The distribution of the trait largely coincides with the cultural region of California. Within this area, the polysemy ‘earth/year’ is attested from Molala in the north to Seri in the south. The trait in question is apparently old in Yuman, Chumashan and Yuki-Wappo, whereas Uto-Aztecan languages acquired it as a result of contact with other families. However, a number of outliers are attested outside California: languages of the Northern Plains and adjoining regions of Great Lakes (Winnebago, Lakota-Dakota, Skiri Pawnee, Menominee), Southeastern Tepehuan and Oaxaca Chontal. These may result from prehistoric migrations. Presence of this polysemy in Northern Plains languages can be connected to the eastward migration of Algonquian speakers from the Proto-Algic homeland possibly located in the Fraser
River basin. The case of Southeastern Tepehuan is possibly due to prehistoric contacts between Proto-Tepiman and Yuman languages, with the subsequent southward migration of Southeastern Tepehuan speakers. Oaxaca Chontal belongs to a hypothetical Hokan family, whose other branches are located in California. Moreover, Oaxaca
Chontal word for ‘earth/year’ is cognate to words with the same meaning in Yuman and Seri.
Linguistica Uralica, 2019
The main goal of this paper is compiling the Swadesh lists for five Finnic varieties: Votic, Esto... more The main goal of this paper is compiling the Swadesh lists for five Finnic varieties: Votic, Estonian, Finnish, and the Soikkola and Lower Luga dialects of the Ingrian language. The lists are compiled using the methodology developed by the Moscow School of Comparative Linguistics. The meaning of the target words is specified not just with the translation equivalent but also with the context. Words for the lists are selected in cooperation with native speakers who help to choose the most suitable word from several synonymic variants. The resulting lists contain 111 words. For each word, etymological comments are provided. The paper also offers some preliminary observations concerning the core lexicon of the discussed varieties. In particular, we investigate the lexicostatistical distances between the languages and analyse the directions of borrowings. One of the conclusions of the research is that the lexico-statistic difference between closely related languages does not have a strong correlation with their genetic distance. The three minor varieties (Votic and two Ingrian dialects) are more similar to each other than to either of the major languages (Estonian and Finnish). The latter demonstrate more language-specific items in the core lexicon.
Основной целью статьи является построение списков Сводеша для пяти прибалтийско-финских идиомов: водского, эстонского и финского языков, а также сойкинского и нижнелужского диалектов ижорского языка. Принципиальное внимание уделяется методике построения списков: это применяемая в Московской школе компаративистики методика, при которой семантика включаемого в список слова задается не только переводом, но и контекстом употребления. Слова для списка отбирались во взаимодействии с носителями языка, что позволило находить наиболее подходящее слово из существующих в языке синонимов. Составленные таким образом 111-словные списки сопровождаются этимологическими комментариями к каждому слову. В статье делаются и предварительные наблюдения, касающиеся базового лексического состава рассматриваемых языков, в частности, исследуются сходства и различия лексических списков и рассматриваются механизмы проникновения в них новых слов. Одним из выводов оказывается отсутствие линейной зависимости между схожестью лексических списков и генетической близостью в случае близкородственных языков. Так, между малыми языками наблюдается больше сходства, чем при сравнении малого языка с финским или эстонским, у которых базовая лексика содержит больше конкретно-языковой специфики.
Journal of Language Relationship, 2018
In this paper I present a detailed analysis of a number of morphological comparisons between the ... more In this paper I present a detailed analysis of a number of morphological comparisons between the branches of the hypothetical Hokan family. The following areas are considered: 1) subject person/number markers on verbs, as well as possessor person/number markers on nouns, 2) so-called 'lexical prefixes' denoting instrument and manner of action on verbs, 3) plural infixes, used with both nouns and verbs, and 4) verbal directional suffixes 'hither' and 'thither'. It is shown that the respective morphological parallels can be better accounted for as resulting from genetic inheritance rather than from areal diffusion.
Proto-Khanty is traditionally reconstructed with a retroflex nasal phoneme *ṇ, whose origin remai... more Proto-Khanty is traditionally reconstructed with a retroflex nasal phoneme *ṇ, whose origin remains disputed. According to one theory, it is directly inherited from Proto-Uralic. The other theory holds that Proto-Uralic *n, usually preserved as *n in Khanty, sporadically yielded *ṇ. We argue that Proto-Khanty *ṇ results from a regularly conditioned sound change.
Статья представляет собой подробный аналитический отчёт о конференции The Precursors of Proto-Ind... more Статья представляет собой подробный аналитический отчёт о конференции The Precursors of Proto-Indo-European, состоявшейся в июле 2015 года в Лейденском университете. Тематическая конференция, посвящённая проблемам родства индоевропейских и уральских языков, вызвала большой интерес у лингвистов и историков из разных стран (Россия, Франция, США, Голландия, Швеция, Италия, Финляндия, Венгрия). Участники конференции предложили широкий спектр докладов, где проблема рассматривалась как с точки зрения сравнительно-исторического языкознания, так и через новые методы математического анализа и лексикостатистики.
The paper presents a brief assessment of “Nostratic” – the controversial, but promising hypothesi... more The paper presents a brief assessment of “Nostratic” – the controversial, but promising hypothesis on deeper linguistic connections of the Indo-European family, as envisaged by Vladislav Illich-Svitych and his contemporaries (particularly Aharon Dolgopolsky). We discuss some of the most important developments of the theory since the 1960s, and explain how emphasis on “quantity over quality” of data in the new huge corpora of “Nostratic” comparanda is less useful for advancing the hypothesis than a narrowly targeted emphasis on identifying the “core” evidence for the macrofamily. Identifying this “core” evidence, consisting of a small, but generally stable layer of the basic lexicon, is necessary to lend a more historically realistic flavor to the hypothesis, and its statistical evaluation will also help better understand the place of Indo-European among the other potential constituents of “Nostratic”. We argue that, in weighing the evidence, typological plausibility of semantic shifts and absence of topological conflicts in the tree are no less important than regularity of sound changes. We also show how the credibility level of various theories on the external connections of Indo-European can be arranged along a gradient – from “Indo-Uralic” to a general “Nostratic”, and indicate implications that such an arrangement may hold for future studies.
In this paper we discuss the results of an automated comparison between two 50-item groups of the... more In this paper we discuss the results of an automated comparison between two 50-item groups of the most generally stable elements on the so-called Swadesh wordlist as reconstructed for Proto-Indo-European and Proto-Uralic. Two forms are counted as potentially related if their first two consonantal units, transcribed in simplified consonantal class notation (a rough variant of the Levenshtein distance method), match up with each other. Next to all previous attempts at such a task (Ringe 1998; Oswalt 1998; Kessler & Lehtonen 2006; Kessler 2007), our automated algorithm comes much closer to emulating the traditional procedure of cognate search as employed in historical linguistics. " Swadesh slots " for protolan-guages are filled in strict accordance with such principles of reconstruction as topology (taking into consideration the structure of the genealogical tree), morphological transparency , typology of semantic shifts, and areal distribution of particular items. Altogether we have counted 7 pairs where Proto-Indo-European and Proto-Uralic share the same bi-consonantal skeleton (the exact same pairs are regarded as cognates in traditional hypotheses of Indo-Uralic relationship). To verify the probability of arriving at such a result by chance we have applied the permutation test, which yielded a positive result: the probability of 7 matched pairs is equal to 1.9% or 0.5%, depending on the constituency of the consonantal classes, which is lower than the standard 5% threshold of statistical significance or even lower than the strong 1% level. Standard methodology suggests that we reject the null
hypothesis (accidental resemblance) and offer a more plausible
explanation for the observed similarities. Since the
known typology of language contacts does not speak in favor
of explaining the observed Indo-Uralic matches as old lexical
borrowings, the optimal explanation is seen in the hypothesis
of an Indo-Uralic genetic relationship, with the 7 matching
pairs in question representing archaic retentions, left over
from the original Indo-Uralic protolanguage.
In this paper we discuss the results of an automated comparison between two 50-item groups of th... more In this paper we discuss the results of an automated comparison between two 50-item groups of the most generally stable elements on the so-called Swadesh wordlist as reconstructed for Proto-Indo-European and Proto-Uralic. Two forms are counted as potentially related if their first two consonantal units, transcribed in simplified consonantal class notation (a rough variant of the Levenshtein distance method), match up with each other. Next to all previous attempts at such a task (Ringe 1998, Oswalt 1998, Kessler & Lehtonen 2006, Kessler 2007), our automated algorithm comes much closer to emulating the traditional procedure of cognate search as employed in historical linguistics. “Swadesh slots” for protolanguages are filled in strict accordance with such principles of reconstruction as topology (taking into consideration the structure of the genealogical tree), morphological transparency, typology of semantic shifts, and areal distribution of particular items. Altogether we have counted 7 pairs where Proto-Indo-European and Proto-Uralic share the same biconsonantal skeleton (the exact same pairs are regarded as cognates in traditional hypotheses of Indo-Uralic relationship). To verify the probability of arriving at such a result by chance we have applied the permutation test, which yielded a positive result: the probability of 7 matched pairs is equal to 1.9% or 0.5%, depending on the constituency of the consonantal classes, which is lower than the standard 5% threshold of statistic significance or even lower than the strong 1% level. Standard methodology suggests that we reject the null hypothesis (accidental resemblance) and offer a more plausible explanation to the observed similarities. Since the known typology of language contacts does not speak in favor of explaining the observed Indo-Uralic matches as old lexical borrowings, the optimal explanation is seen in the hypothesis of Indo-Uralic genetic relationship, with the 7 matching pairs in question representing archaic retentions, left over from the original Indo-Uralic protolanguage.
Published 2015; in: Journal of Indo-European Studies 43(3-4): 301-347.
The file also includes the response to the subsequent discussion published in the same volume: Kassian, Alexei, Mikhail Zhivlov, George Starostin. 2015. Lexicostatistics, probability, and other matters. JIES 43(3-4): 376-392.
The paper discusses three issues in the history of Uralic vocalism: the change of Proto-Uralic vo... more The paper discusses three issues in the history of Uralic vocalism: the change of Proto-Uralic vowel combination *ä-ä to Proto-Finnic *a-e, the fate of Proto-Uralic *ï before velar consonants in Finnic, Saami and Mordvin, and the possibility of reconstructing two distinct vowels in PU non-initial syllables instead of *a of the traditional reconstruction. It is argued that the development of Uralic vocalism must be described in terms of strict sound laws, and not of “sporadic developments”.
К статье В. В. Понарядова «О финно-пермском вокализме» Работа В. В. Понарядова -первая известная ... more К статье В. В. Понарядова «О финно-пермском вокализме» Работа В. В. Понарядова -первая известная нам попытка восстановить прафинно-пермский вокализм, основываясь на классической методологии сравнительно-исторического языкознания, не допускающей массовых спорадических изменений фонем. Уральская семья зачастую упоминается в пособиях по компаративистике как одна из самых хорошо изученных в сравнительно-историческом плане языковых семей мира (см., напр., [Campbell, 2004, 186]). Действительно, уралистика -одна из старейших областей сравнительноисторического языкознания: по объёму существующей литературы она уступает разве что индоевропеистике, имеются этимологические словари как для семьи в целом, так и для ряда отдельных языков. Тем не менее, даже при поверхностном сравнении работ по исторической фонетике и этимологии уральских языков с аналогичными работами по таким языковым семьям, как алгонкинская, австронезийская, банту, ирокезская, ияк-атапаскская, михе-соке (не говоря уже об индоевропейской) бросается в глаза разительное отличие. Сравнительная фонетика упомянутых выше (и многих других) семей строится на методологических принципах, восходящих к младограмматикам. Согласно этим принципам, формы дочерних языков должны регулярно выводиться из реконструированных форм праязыка, а любые возможные отклонения должны быть как-то объяснены или по крайней мере особо оговорены. Системные, повторяющиеся исключения из фонетических законов должны сами объясняться фонетическими законами, а формы, не обнаруживающие регулярных фонетических соответствий, не должны считаться родственными. С сожалением приходится констатировать, что работ, следующих такой методологии, в уралистике крайне мало (прежде всего можно назвать работы и , а также ряд статей А. Айкио, напр., ). Распространённую в уралистике методологию, на которой основывается наиболее авторитетный этимологический словарь семьи -UEW, -можно охарактеризовать как домладограмматическую. Место звуковых законов в ней занимают необязательные «тенденции», а реконструкции опираются не на регулярные соответствия, а на принцип «ключевого
Реплика по поводу статьи В. В. Понарядова «Отражение прафинно-пермских конечных гласных второго с... more Реплика по поводу статьи В. В. Понарядова «Отражение прафинно-пермских конечных гласных второго слога в эрзянском языке»
The paper presents a set of rules that explain the complementary distribution of the reflexes of ... more The paper presents a set of rules that explain the complementary distribution of the reflexes of alleged Proto-Uralic vowels *ɨ and *å in Proto-Samoyed, Proto-Mansi and Proto-Permic. Our aim is to show that the reconstruction of one vowel *a instead of these two phonemes is sufficient for the explanation of all the reflexes in the languages under consideration.
Uploads
Papers by Mikhail Zhivlov
River basin. The case of Southeastern Tepehuan is possibly due to prehistoric contacts between Proto-Tepiman and Yuman languages, with the subsequent southward migration of Southeastern Tepehuan speakers. Oaxaca Chontal belongs to a hypothetical Hokan family, whose other branches are located in California. Moreover, Oaxaca
Chontal word for ‘earth/year’ is cognate to words with the same meaning in Yuman and Seri.
Основной целью статьи является построение списков Сводеша для пяти прибалтийско-финских идиомов: водского, эстонского и финского языков, а также сойкинского и нижнелужского диалектов ижорского языка. Принципиальное внимание уделяется методике построения списков: это применяемая в Московской школе компаративистики методика, при которой семантика включаемого в список слова задается не только переводом, но и контекстом употребления. Слова для списка отбирались во взаимодействии с носителями языка, что позволило находить наиболее подходящее слово из существующих в языке синонимов. Составленные таким образом 111-словные списки сопровождаются этимологическими комментариями к каждому слову. В статье делаются и предварительные наблюдения, касающиеся базового лексического состава рассматриваемых языков, в частности, исследуются сходства и различия лексических списков и рассматриваются механизмы проникновения в них новых слов. Одним из выводов оказывается отсутствие линейной зависимости между схожестью лексических списков и генетической близостью в случае близкородственных языков. Так, между малыми языками наблюдается больше сходства, чем при сравнении малого языка с финским или эстонским, у которых базовая лексика содержит больше конкретно-языковой специфики.
hypothesis (accidental resemblance) and offer a more plausible
explanation for the observed similarities. Since the
known typology of language contacts does not speak in favor
of explaining the observed Indo-Uralic matches as old lexical
borrowings, the optimal explanation is seen in the hypothesis
of an Indo-Uralic genetic relationship, with the 7 matching
pairs in question representing archaic retentions, left over
from the original Indo-Uralic protolanguage.
Published 2015; in: Journal of Indo-European Studies 43(3-4): 301-347.
The file also includes the response to the subsequent discussion published in the same volume: Kassian, Alexei, Mikhail Zhivlov, George Starostin. 2015. Lexicostatistics, probability, and other matters. JIES 43(3-4): 376-392.
River basin. The case of Southeastern Tepehuan is possibly due to prehistoric contacts between Proto-Tepiman and Yuman languages, with the subsequent southward migration of Southeastern Tepehuan speakers. Oaxaca Chontal belongs to a hypothetical Hokan family, whose other branches are located in California. Moreover, Oaxaca
Chontal word for ‘earth/year’ is cognate to words with the same meaning in Yuman and Seri.
Основной целью статьи является построение списков Сводеша для пяти прибалтийско-финских идиомов: водского, эстонского и финского языков, а также сойкинского и нижнелужского диалектов ижорского языка. Принципиальное внимание уделяется методике построения списков: это применяемая в Московской школе компаративистики методика, при которой семантика включаемого в список слова задается не только переводом, но и контекстом употребления. Слова для списка отбирались во взаимодействии с носителями языка, что позволило находить наиболее подходящее слово из существующих в языке синонимов. Составленные таким образом 111-словные списки сопровождаются этимологическими комментариями к каждому слову. В статье делаются и предварительные наблюдения, касающиеся базового лексического состава рассматриваемых языков, в частности, исследуются сходства и различия лексических списков и рассматриваются механизмы проникновения в них новых слов. Одним из выводов оказывается отсутствие линейной зависимости между схожестью лексических списков и генетической близостью в случае близкородственных языков. Так, между малыми языками наблюдается больше сходства, чем при сравнении малого языка с финским или эстонским, у которых базовая лексика содержит больше конкретно-языковой специфики.
hypothesis (accidental resemblance) and offer a more plausible
explanation for the observed similarities. Since the
known typology of language contacts does not speak in favor
of explaining the observed Indo-Uralic matches as old lexical
borrowings, the optimal explanation is seen in the hypothesis
of an Indo-Uralic genetic relationship, with the 7 matching
pairs in question representing archaic retentions, left over
from the original Indo-Uralic protolanguage.
Published 2015; in: Journal of Indo-European Studies 43(3-4): 301-347.
The file also includes the response to the subsequent discussion published in the same volume: Kassian, Alexei, Mikhail Zhivlov, George Starostin. 2015. Lexicostatistics, probability, and other matters. JIES 43(3-4): 376-392.
ностр. *KUCV- > ИЕ *KweC-;
ностр. *CURV- > ИЕ *CeR-;
ностр. *CUTV- > ИЕ *Сeu̯T- ~ *Cu̯eT-.
Мы предлагаем уточнения к этой системе, в результате которых она принимает следующий вид:
ностр. *Cu/üCCV- > ИЕ *Ce(C)C- / *Kwe(C)C-;
ностр. *Cu/üTV- > ИЕ *Ceu̯T- / *K̂eu̯T-;
ностр. *Cu/üRV- > ИЕ *CReu̯- / *K̂Reu̯-;
ностр. *CujV- > ИЕ *Cei̯- / *K̂ei̯-;
ностр. *CoCCV- > ИЕ *Ce(C)C- / *Kwe(C)C-;
ностр. *CoCV- > ИЕ *Cu̯eC- / *PeC-
(C = согласный, T = шумный, R = сонант, P = лабиальный, K = велярный, K̂ = ИЕ палатальный, Kw = ИЕ лабиовелярный, V = гласный, U = огубленный гласный, e = ИЕ аблаутный гласный e/o/Ø).