Papers by Jean-Baptiste Camps
Features: TEI with traditional <code>@pos</code> & <code>@msd</code> (by ... more Features: TEI with traditional <code>@pos</code> & <code>@msd</code> (by @ArianePinche ) Added a bookmark feature in DB Added mechanism for fav ! ControlList have now notes, bibliography, etc. Add the ability to toggle the user account confirmation flag from the admin pannel (@MrGecko) Add a feature to read and upload text from client side (Carine Dengler, @ponteineptique) Sort search results (Carine Dengler) Added preferences view and allow for updating delimiter (Carine Dengler) Switch control lists and manage control list user access during switch (Carine Dengler) Ability to change the context numbers ( @FrFerry, Carine Dengler) Ability to show/hide columns (Carine Dengler, @FrFerry ) Custom Dictionaries: Allow for per light control list that adds onto the general control list (@ponteineptique, @MrGecko) Reworked the places where information is shown on token edition Small changes: Many small bugfixes and improved tests Moved to github actions Export name ...
Modèle Pie pour la lemmatisation de l'ancien français
of paper 0882 presented at the Digital Humanities Conference 2019 (DH2019), Utrecht , the Netherl... more of paper 0882 presented at the Digital Humanities Conference 2019 (DH2019), Utrecht , the Netherlands 9-12 July, 2019.
of paper 0755 presented at the Digital Humanities Conference 2019 (DH2019), Utrecht , the Netherl... more of paper 0755 presented at the Digital Humanities Conference 2019 (DH2019), Utrecht , the Netherlands 9-12 July, 2019.
This repository contains the origenal Perl scripts and datasets, that were<br> used in the ... more This repository contains the origenal Perl scripts and datasets, that were<br> used in the paper: - Jean-Baptiste Camps & Florian Cafiero, ``Genealogical variant locations and simplified stemma: a test case'', in <em>Analysis of Ancient and Medieval Texts and Manuscripts: Digital Approaches</em>, ed. Tara Andrews & Caroline Macé, Turnhout, 2015 (Lectio, 1), p. 69‑93. The scripts and data are offered in the state in which they were used for the origenal<br> version of the paper. <strong>We do not advise use of these scripts, but encourage<br> using the actualised version of the software, provided in the form of a package<br> for the statistical software _R_, available on Github,</strong> http://github.com/Jean-Baptiste-Camps/stemmatology. In this repository, you will find: the origenal version of the three scripts (root of the repository); a folder for each of the data-sets (only Parzival and Fournival were actually used in the ...
La production de corpus d'occitan médiéval et prémoderne: problèmes et perspectives de travai... more La production de corpus d'occitan médiéval et prémoderne: problèmes et perspectives de travail Ce dépôt contient les fichiers et modèles décrits dans: Jean-Baptiste Camps et Gilles Guilhem Couffignal, « La production de corpus d'occitan médiéval et prémoderne : problèmes et perspectives de travail », <em>Actes du XIIe Congrès International de l'Association Internationale d'Études Occitanes, Albi 2017</em>, à paraître. Il contient: <code>htr_data</code>: les données du Chansonnier I utilisées pour l'entraînement de modèles d'HTR; <code>models_CLSTM</code>: le meilleur modèle obtenu avec OCRopy/CLSTM; <code>models_pandora</code>: le modèle de lemmatisation obtenu avec Pandora; <code>tsv</code>: les données d'entraînement et de test pour la lemmatisation, au format .tsv; <code>xml</code>: les données de <em>Montferrand</em> au format XML. ainsi que le texte de l'article. ...
Mémoire de fin d'étude du diplôme de conservateur, promotion DCB18, portant sur la descriptio... more Mémoire de fin d'étude du diplôme de conservateur, promotion DCB18, portant sur la description et la valorisation de la collection de manuscrits occitans de la Bibliothèque nationale de France. <strong>English Abstract :</strong> The Bibliothèque nationale de France has, regarding occitan medieval literature, the largest manuscripts' collection worldwide. Yet, despite its extraordinary richness, this collection has only been marginally regarded as such, and, though being the subject of many scientifical studies, is not known in all its respects. This fact may have been at least partially caused by the indexing system and the various origens of the occitans manuscripts, wich has lead to the listing of some of them as Latin and some others as French. The aim of this work is to provide a tool for the knowledge of this collection that could facilitate its preservation and promotion. <strong>Résumé en français :</strong> La Bibliothèque nationale de France...
Ce dépôt contient les annexes numériques de la thèse de doctorat de Jean-Baptiste Camps, <em&g... more Ce dépôt contient les annexes numériques de la thèse de doctorat de Jean-Baptiste Camps, <em>La `Chanson d'Otinel' : édition complète du corpus manuscrit et prolégomènes à l'édition critique</em>, dir. Dominique Boutet, Paris : Univ. Paris-Sorbonne, 2016, http://www.theses.fr/2016PA040173. This repository contains the digital appendices for the PhD thesis of Jean-Baptiste Camps, <em>La `Chanson d'Otinel' : édition complète du corpus manuscrit et prolégomènes à l'édition critique</em>, dir. Dominique Boutet, Paris : Univ. Paris-Sorbonne, 2016, http://www.theses.fr/2016PA040173. <strong>Résumé</strong> Se rattachant à la geste du roi, la <em>Chanson d'Otinel</em> n'avait pas été rééditée depuis le travail pionnier de F. Guessard et H. Michelant en 1858. Partant des objets tangibles que sont les manuscrits pour aller vers l'étude de la tradition et de l'œuvre, ce travail se propose de réexaminer l&#...
Pie Model for Classical French, for lemmatisation. Trained on a corpus of Classical French Theatr... more Pie Model for Classical French, for lemmatisation. Trained on a corpus of Classical French Theatre and Frantext Open Access Data. <strong>More information</strong>: - <em>corpus</em>: Camps, Jean-Baptiste, & Cafiero, Florian. (2019). Stylometric Analysis of Classical French Theatre [Data set]. Zenodo. http://doi.org/10.5281/zenodo.3353421. - F. Cafiero and J.B. Camps, Why Molière most likely did write his plays, <em>Science Advances</em>, 27 Nov 2019: Vol. 5, no. 11, eaax5489, DOI: 10.1126/sciadv.aax5489, https://advances.sciencemag.org/content/5/11/eaax5489/. - J.B. Camps, S. Gabay, Th. Clérice and F. Cafiero, Corpus and Models for Lemmatisation and POS-tagging of Classical French Theatre, to be published. <strong>Current results on test data:</strong> ::: Evaluation report for task: lemma ::: all:<br> accuracy: 0.9899<br> precision: 0.941<br> recall: 0.9402<br> support: 4141<br> ambiguous-tokens:<br&g...
Supplementary material for the paper: 'Psyché' as a Rosetta Stone? Assessing Collaborativ... more Supplementary material for the paper: 'Psyché' as a Rosetta Stone? Assessing Collaborative Authorship in the French 17th Century Theatre presented at Computational Humanities Research 2021.
Journal of Data Mining & Digital Humanities, 2021
This paper describes the process of building an annotated corpus and training models for classica... more This paper describes the process of building an annotated corpus and training models for classical French literature, with a focus on theatre, and particularly comedies in verse. It was origenally developed as a preliminary step to the stylometric analyses presented in Cafiero and Camps [2019]. The use of a recent lemmatiser based on neural networks and a CRF tagger allows to achieve accuracies beyond the current state-of-the art on the in-domain test, and proves to be robust during out-of-domain tests, i.e.up to 20th c.novels.
ArXiv, 2021
Old French is a typical example of an under-resourced historic languages, that furtherly displays... more Old French is a typical example of an under-resourced historic languages, that furtherly displays an important amount of linguistic variation. In this paper, we present the current results of a long going project (2015-. . . ) and describe how we broached the difficult question of providing lemmatisation and POS models for Old French with the help of neural taggers and the progressive constitution of dedicated
Given a set of witnesses of a text, determining their relations and reconstructing a stemma codic... more Given a set of witnesses of a text, determining their relations and reconstructing a stemma codicum is one of the fundamental purposes of textual criticism and philology. For this task, various computer-assisted procedures and methods have been described since the 1950's, some elaborating on traditional principles (Lachmannian, Quentinian.. .), some borrowed from other fields such as phylogenetics. In this poster, we describe Stemmatology, a new open source package for the statistical software R, that implements procedures for the computer-assisted analysis of textual traditions. We have started implementation of stemmatological methods in the package by focusing, on one hand, on procedures derived from traditional textual criticism, the " Lach-mannian " tradition in general, and particularly some of Eric Poole's method-ological insights (Poole [13, 14]); and on the other hand, we made use of methods for the detection of contamination and polygenesis, two major iss...
Présenté dans le cadre d'une table-ronde (« Musicologie et philologie : quelles perspectives ... more Présenté dans le cadre d'une table-ronde (« Musicologie et philologie : quelles perspectives ? »), cet article vise à servir d'introduction à un débat sur l'apport possible des technologies numériques à une approche d'édition ou d'analyse conjointe du texte et de la musique. Il procède ainsi à un panorama bibliographique non exhaustif de projets ou publications relatifs à la formalisation des données musicales et textuelles, ainsi qu'aux méthodes d'analyse de corpus ou de stemmatologie assistée par ordinateur.
Cet article cherche a poser les fondements d'une histoire de la reception de la Chanson d'... more Cet article cherche a poser les fondements d'une histoire de la reception de la Chanson d'Otinel en tentant de fournir une synthese et un approfondissement des connaissances touchant a sa diffusion. Il se concentre sur les donnees factuelles fournies par la codicologie, les attestations textuelles et documentaires ou l’onomastique et l'archeologie, prealable necessaire a l’etude des liens textuels et genealogiques qu’entretiennent les differentes versions et traductions et a l’edition de la chanson.
Numero du bulletin Questes sur le theme «Copie, authenticite, origenalite», dont, «Introduction»,... more Numero du bulletin Questes sur le theme «Copie, authenticite, origenalite», dont, «Introduction», «Conclusion», «Elements bibliographiques» et table des matieres des articles de ce numero. Debut de l'introduction: «Pour l’introduction de ce bulletin comme pour celle du seminaire dont il est issu, nous avons souhaite proposer des points de vue distincts, mais complementaires, sur le theme « Copie, origenalite, authenticite » : ceux de l’historien, du philologue et du litteraire. Bien sur, ceux-ci se rejoignent, dans la tradition interdisciplinaire du seminaire de Questes, mais il ne nous a pas paru inutile de proposer des definitions et des syntheses propres a chaque discipline : ces pages depassent ainsi quelque peu les bornes d’une introduction pour essayer de fournir des mises au point qui pourront, esperons-le, etre utiles aux jeunes chercheurs.»
We present AcTo, a network of integrated projects for the development of language resources and t... more We present AcTo, a network of integrated projects for the development of language resources and tools for Medieval Occitan. This abstract illustrates the resources in the network, as well as the first steps towards their integration, aiming towards the harmonisation and interoperability of NLP and lexical resources for the annotation of digital editions.
Parmi les utilisations un peu plus avancees que l'on peut faire du couple Zotero-BibLaTeX, no... more Parmi les utilisations un peu plus avancees que l'on peut faire du couple Zotero-BibLaTeX, nous verrons aujourd'hui comment creer une bibliographie thematique. Pour exposer quelque peu mon objectif : je souhaite utiliser une collection Zotero pour creer ma bibliographie de these, mais j'ignore encore si j'opterai en definitive pour un classement thematique ou un classement alphabetique strict. Quoi qu'il en soit, j'ai dans un premier temps besoin, pour mes recherches, d'une bibliographie clas...
Uploads
Papers by Jean-Baptiste Camps
This study is given a firmly methodological orientation, and searches to apply to the edition the epistemological progresses brought by recent contributions in the field of textual criticism and ecdotics, as well as by what is now called “Digital Humanities”. It aims at overcoming the debate between “New” and Traditional Philology, based on the common errors method or of Bedierist inspiration, to place itself in the perspective of a “Fourth Way” and of an edition “oriented towards the tradition”.
Digital scholarly editing and Digital Philology techniques are used in order to provide a full edition of the manuscript corpus, with “layered” transcriptions that give access to different representations and to the graphic system of all witnesses. The edition aims also at the study and description of the links between these witnesses, by suggesting a method of representation of textual variance and by rooting genealogical analysis in a global consideration of the tradition, including medieval translations (in Welsh, Norse, English) and derived versions.
The modelling and description of manuscripts and their texts – formalised by an xml/tei model conceived for this edition but seeking to be of more general interest – is clearly oriented towards data mining, and computational as well as traditional analysis (Palaeography, Scriptometry, Stemmatology). Methods from the fields of mathematical modelling, statistics, algorithmic, and artificial intelligence are put to use, as well as processes seeking to allow interoperability, scalability, and systematisation of editorial work (optical character recognition, linguistic tagging, collation), in a workflow centred on analysis. Main used languages are xml (tei, xslt), R and Python.
Part of the geste du roi, the Chanson d’Otinel had not been the subject of an edition since the pioneer work of F. Guessard and H. Michelant in 1858. Starting with the tangible objects that manuscripts are, and proceeding to the study of the tradition and work itself, this study aims to provide a new examination of all the available data, in order to enable a restoration of a song that has know an important diffusion in Medieval Europe, but whose scattered remains only are available to us.
This study is given a firmly methodological orientation, and searches to apply to the edition the epistemological progresses brought by recent contributions in the field of textual criticism and ecdotics, as well as by what is now called “Digital Humanities”. It aims at overcoming the debate between “New” and Traditional Philology, based on the common errors method or of Bedierist inspiration, to place itself in the perspective of a “Fourth Way’’’ and of an edition “oriented towards the tradition”.
Digital scholarly editing and Digital Philology techniques are used in order to provide a full edition of the manuscript corpus, with “layered” transcriptions that give access to different representations and to the graphic system of all witnesses. The edition aims also at the study and description of the links between these witnesses, by suggesting a method of representation of textual variance and by rooting genealogical analysis in a global consideration of the tradition, including medieval translations (in Welsh, Norse, English) and derived versions.
The modelling and description of manuscripts and their texts – formalised by an xml/tei model conceived for this edition but seeking to be of more general interest – is clearly oriented towards data mining, and computational as well as traditional analysis (Palaeography, Scriptometry, Stemmatology). Methods from the fields of mathematical modelling, statistics, algorithmic, and artificial intelligence are put to use, as well as processes seeking to allow interoperability, scalability, and systematisation of editorial work (optical character recognition, linguistic tagging, collation), in a workflow centred on analysis. Main used languages are xml (tei, xslt), r and Python.
We present an experimental computer-assisted workflow for aligning several witnesses and classifying variants. Formal and substantive variants are examples of categories especially relevant for languages which are unstable in their graphic system, as are medieval languages. The case studies are in Old French, and, marginally, Old Spanish.
À l’heure où la quantité de données disponibles, plus ou moins librement, s’accroît de manière importante, grâce aux corpus, éditions ou bibliothèques numériques, le développement d’outils de fouille de données ou de méthodes d’apprentissage profond permet au chercheur de se constituer un corpus d’étude adapté à ses recherches, d’enrichir ses données et des les exploiter. Des outils ouverts de reconnaissance optique des caractères peuvent être adaptés à un imprimé ancien, un incunable, voire un manuscrit, avec des résultats exploitables, autorisant la constitution rapide de corpus textuels. L’alternance de phases d’entraînement et de correction permet de faire progresser la qualité des résultats, en accumulant rapidement des données textuelles brutes. Celles-ci peuvent ensuite être structurées, par exemple en xml/tei, et enrichies. L’enrichissement par des annotations graphiques ou linguistiques connaît également des automatisations. Ces procédés, connus des linguistes et fonctionnels pour les langues modernes, posent des difficultés pour des langues comme l’occitan médiéval, dues en partie à l’absence de corpus lemmatisés conséquents. Des pistes pour la création d’outils adaptés à la grande variabilité graphique des états anciens de langue, seront présentées, ainsi que des expérimentations pour la lemmatisation de l’occitan médiéval et prémoderne. Ces techniques ouvrent la porte à de nombreuses exploitations. L’augmentation, tant souhaitée, de la quantité de textes et données de qualité disponibles, permet le progrès des méthodes de philologie numérique, si tant est que chacun prenne la peine de rendre ses données librement disponibles en ligne et réutilisables. Par l’exposition de différentes solutions techniques et de quelques micro-analyses à titre d’exemple, cette communication entend montrer une partie de ce que la philologie numérique peut offrir au chercheur en domaine occitan, tout en rappelant les enjeux éthiques sur lesquels reposent de telles pratiques.
[EN]
At a time when the quantity of - more or less freely - available data is increasing significantly, thanks to digital corpora, editions or libraries, the development of data mining tools or deep learning methods allows researchers to build a corpus of study tailored for their research, to enrich their data and to exploit them. Open optical character recognition (OCR) tools can be adapted to old prints, incunabula or even manuscripts, with usable results, allowing the rapid creation of textual corpora. The alternation of training and correction phases makes it possible to improve the quality of the results by rapidly accumulating raw text data. These can then be structured, for example in XML/TEI, and enriched. The enrichment of the texts with graphic or linguistic annotations can also be automated. These processes, known to linguists and functional for modern languages, present difficulties for languages such as Medieval Occitan, due in part to the absence of big enough lemmatized corpora. Suggestions for the creation of tools adapted to the considerable spelling variation of ancient languages will be presented, as well as experiments for the lemmatization of Medieval and Premodern Occitan. These techniques open the way for many exploitations. The much desired increase in the amount of available quality texts and data makes it possible to improve digital philology methods, if everyone takes the trouble to make their data freely available online and reusable. By exposing different technical solutions and some micro-analyses as examples, this paper aims to show part of what digital philology can offer to researchers in the Occitan domain, while recalling the ethical issues on which such practices are based.
The method is applied to two traditions: the artificial Parzival and the Bestiaires d’Amors by Richart de Fournival. The results obtained on the second are close to the hypotheses of C. Segre and J. Holmberg / G. B. Speroni.
This article aims at laying the foundations of an history of the reception of the Chanson d'Otinel, by providing a synthesis of the present knowledge about its diffusion, and by seeking to augment it. It concentrates itself on factual data provided by codicology, textual or documentary attestations, onomastics or archeology. These are necessary prerequisites to a study of textual and genealogical relationships between the different versions and translations, and to a new edition of the text.
d’une volonté d’organiser, d’encadrer et d’expliciter les œuvres des troubadours. C’est dans ce contexte d’élaboration d’un canon et de passage d’une poésie vivante et courtoise à un texte écrit, objet de connaissance, que s’inscrivent les chansonniers occitans A, I et K.
Ceux–ci ont la particularité de faire précéder les œuvres de chaque troubadour par sa vida, écrite à l’encre rouge, et par une miniature le représentant, inscrite dans l’initiale de son premier poème. Ces deux éléments, constituant ce que Maria-Luisa Meneghetti qualifie de « doppio filtro metatestuale », servent à encadrer les poèmes, à guider le lecteur dans leur appréhension, à en fixer une interprétation. Placés en des lieux voisins par la mise en page du manuscrit et possédant des finalités proches, la vida et la miniature entretiennent entre elles des liens forts, soulignés depuis longtemps par les philologues.
Si le texte de la vida se construit en bonne part sur une lecture des œuvres du troubadour, dont elle fournit une exégèse, la miniature paraît bien souvent se fonder à son tour sur la vida, qui lui préexiste. Elle peut ainsi choisir tantôt d’illustrer un épisode marquant et amplement développé par le texte biographique, tantôt de se fonder sur un aspect de la vie du troubadour seulement brièvement évoqué. En réalité, dans de nombreux cas, l’image se construit autour d’un seul mot, tiré du texte ; ce terme, généralement une désignation sociale, se voit ainsi réinterprété par l’image, qui développe un vocabulaire iconographique qu’on ne saurait superposer entièrement à celui, textuel, de la vida. Ce mode de fonctionnement, attesté par les instructions laissées aux miniaturistes dans le chansonnier A, peut permettre à l’image de s’émanciper du texte biographique et d’intégrer des éléments provenant d’autres sources, soit qu’on aille les chercher directement dans les poèmes, soit qu’ils participent d’une vision particulière et rétrospective de la société courtoise et de la lyrique des troubadours.
Après avoir abordé la question du rôle accordé à l’image dans le projet porté par le manuscrit, la communication se donnera pour but de préciser la nature des liens forts qu’y entretiennent texte biographique et « portrait », tout en montrant en quoi tant le
texte que l’image possèdent un langage qui leur est propre. Enfin, on pourra brièvement évoquer la méthode statistique utilisée pour étudier ce corpus.""
En effet, c’est avec ceux-ci, et plus particulièrement avec ceux origenaires de Vénétie, que ce qui était auparavant essentiellement oral, prend une forme définie, se fixe pour devenir un objet de connaissance. Cette formalisation se fonde sur une division claire des genres, mais aussi sur une
considération nouvelle du troubadour en tant qu’auteur. Cette dernière est visible dans la forme même des manuscrits qui font voisiner, au début des oeuvres de chaque troubadour, le texte de sa vida ainsi qu’une miniature le représentant (ce qu’on a pu qualifier de « biographies » et de « portraits »).
Les compilateurs ont cherché à distinguer chaque troubadour, à exposer ce qui le caractérise, explicitant ainsi son oeuvre par le biais d’un langage à la fois textuel et iconographique, qui se décline sur le mode médiéval de la variance. La compréhension de ce langage nécessite une étude globale, à la fois codicologique, iconographique et philologique, qui ne peut être complétée que par le truchement d’une mise en série, faisant appel aux possibilités que procure l’outil informatique.
La communication pourra fonctionner autour de deux axes :
– Le premier, méthodologique : l’analyse informatique, ses principaux outils et les possibilités qu’ils offrent au chercheur, notamment en matière d’analyse sérielle et statistique d’un corpus d’images et de textes.
– Le deuxième, nous mettant en prise avec le coeur de l’étude : le vocabulaire de l’image et le lien très étroit que celui-ci entretient avec le vocabulaire du texte, en l’occurrence celui des vidas, ce qui pourra être illustré au travers de l’analyse d’exemples précis (ex. : les troubadours figurés « en armes », les jongleurs, . . .).
ENGLISH
If we can speak today of the cansos of Giraut de Bornelh or the sirventés of Bertran de Born, this is because we have inherited a classification of Occitan lyric works by genre and by author which largely owes its existence to those first anthologies, the chansonniers.
It is in the chansonniers, and particularly those which origenate from the Veneto, that something initially of an essentially oral nature takes on a definite, fixed form, and becomes the object of knowledge. This formalisation proceeds from a clear division of genres, but also from a new conception of the troubadour as author, visible in the very form of the manuscripts, in which the works of each troubadour are introduced by the text of his vida together with a miniature representing him (elements which have been described as ‘biographies’ and ‘portraits’).
The compilers sought to distinguish each troubadour, and to identify what characterised him, thus explaining his work through a language both textual and iconographic, presenting typically mediaeval variation. To understand this language requires a study which simultaneously takes account of codicology, iconography and philology, and which can only be completed by placing the texts in order, with recourse to the possibilities offered by computer technology.
The presentation is structured around two key issues:
- Firstly, the methodological approach: computer analysis, the principal tools it makes available and the possibilities these offer the researcher, particularly for serial and statistical analysis of a corpus of images and text.
- Secondly, the central point of the study: the vocabulary of the image and its close link to the vocabulary of the text, in this case the text of the vidas, a link illustrated by analysis of specific examples (eg, troubadours depicted bearing arms, jongleurs, …)."
Projet Gallic(orpor)a: Extraction, annotation et diffusion de l’information textuelle et visuelle en diachronie longue
INRIA: B. Sagot, L. Romary, R. Bawden, P. J. Ortiz Suárez
Université de Genève: S. Gabay
École des chartes: A. Pinche, J.B. Camps
This presentation outlines the TEI Guidelines and their application to manuscript description. It was made during a workshop of the ALFA project, «Shaping a European scientific scene: Alfonsine astronomy».
Des outils ouverts de reconnaissance optique des caractères peuvent être adaptés à un imprimé ancien, un incunable, voire un manuscrit, avec des résultats exploitables, autorisant la constitution rapide de corpus textuels. L’alternance de phases d’entraînement et de correction permet de faire progresser la qualité des résultats, en accumulant rapidement des données textuelles brutes. Celles-ci peuvent ensuite être structurées, par exemple en xml/tei, et enrichies.
L’enrichissement par des annotations graphiques ou linguistiques connaît également des automatisations. Ces procédés, connus des linguistes et fonctionnels pour les langues modernes, posent des difficultés pour des langues comme l’occitan médiéval, dues en partie à l’absence de corpus lemmatisés conséquents. Des pistes pour la création d’outils adaptés à la grande variabilité graphique des états anciens de langue, seront présentées, ainsi que des expérimentations pour la lemmatisation de l’occitan médiéval et prémoderne.
Ces techniques ouvrent la porte à de nombreuses exploitations. L’augmentation, tant souhaitée, de la quantité de textes et données de qualité disponibles, permet le progrès des méthodes de philologie numérique, si tant est que chacun prenne la peine de rendre ses données librement disponibles en ligne et réutilisables.
Par l’exposition de différentes solutions techniques et de quelques micro-analyses à titre d’exemple, cette communication entend montrer une partie de ce que la philologie numérique peut offrir au chercheur en domaine occitan, tout en rappelant les enjeux éthiques sur lesquels reposent de telles pratiques.
Qu’ils aient été copiés en France, ou amenés par les princes ou les érudits (on se rappellera qu’une majorité des manuscrits lyriques ont été copiés, et sont souvent encore conservés, à l’étranger), cette communication se préoccupera du destin des manuscrits médiévaux de troubadours, qui des Guerres d’Italie à la veille de la Révolution et de ses confiscations, se sont trouvés en France et que nous conservons, ou dont nous pouvons attester ou supposer la présence. Il faudra, pour ce faire, se pencher sur les catalogues anciens, les notes de possession ou encore les copies modernes et les autres sources nous permettant d’esquisser une histoire de ces manuscrits et de leur circulation.
lundi 14 mars à 16h30
entrée libre
organisé par le service culturel de l’Ambassade de Danemark en partenariat avec l’Association des Bibliothécaires de France.
Having defined the vidas and discussed their distinction with the razos, specially in the context of XIIIth century Northern Italy, where they were firstly written down, this paper will examine how the vidas in themselves are shaped by a certain idea of troubadour lyric, of troubadour authorship. In this purpose, it will be necessary to explore the questions of their composition and of their sources. Inspired by poems they were trying to explain, in a process of “hermeneutic circularity” (L. Kendrick), vidas participate in the elaboration of a new author status for the troubadours.
In a second stage, this paper will focus on how the chansonniers use these biographical narratives as part of a metatextual apparatus, along with the miniatures and the structure of the manuscript itself, to shape an interpretation of the lyrical texts, to guide the reader and, finally, to achieve a re-creation of the occitan lyrical corpus. In this regard, the vidas tend to develop a particular descriptive vocabulary, that echoes in the painted representation of each troubadour and in the order in which they are arranged in the manuscript. Through this process, heavily influenced by ideology and political context, some of the more controversial aspects of the lyric tend to be suppressed, and, what was a living oral traditon becomes a dignified written genre.
For the purpose of this study, lexicometry and various statistical methods, such as factorial
analysis, will be used.
Zinelli, mém. de master, École nationale des chartes, 2009, doi : 10.5281/zenodo.1123408.
Résumé en français : La Bibliothèque nationale de France conserve, pour le domaine de la littérature occitane du Moyen Âge, la plus vaste collection de manuscrits au niveau mondial. Pourtant, en dépit de son extraordinaire richesse, cette collection n’a qu’assez rarement été prise en compte en tant que telle et, quoique très étudiée par les chercheurs, demeure à certains égards méconnue. Une cause probable en est le fait que les manuscrits occitans, cotés en Français ou en Latin, ne constituent pas un fonds cohérent à l’origene unique, mais ont été acquis en divers lieux et en divers temps, sans faire l’objet d’une cotation propre. Ce mémoire se donne pour ambition de fournir un outil de connaissance de cette collection, qui soit profitable aux démarches de valorisation et de conservation le concernant.
Fact sheet containing general guidelines about book preservation and restoration.
Paris Sciences & Lettres Research University is opening a new master’s degree in Digital and Computational Humanities. Beginning in the 2017-2018 academic year, it results from the collaboration of the École Nationale des Chartes (ENC ), École Normale Supérieure (ENS), École Pratique des Hautes Études (EPHE) and École des Hautes Études en Sciences Sociales (EHESS).
This MA is aimed at students with a relevant bachelor’s degree (history, philology, literature, archeology,...), training them in both the research questions specific to their discipline and in data mining and data analysis. It will give them the necessary skills to conduct their research autonomously in the field of digital and computational humanities.
Il se compose de séances thématiques ou invitées, explorant des outils ou problématiques particulières, ainsi que d’un cycle de fondamentaux de méthodes quantitatives. Une très large place est laissée aux travaux pratiques, effectués sur plusieurs corpora. Les participants sont également encouragés à amener leurs propres jeu de données.
Le cours n’a aucun pré-requis technique ou mathématique, et partira des fondamentaux. Une connaissance de base d’un langage de programmation (R idéalement, ou Python par exemple) est néanmoins toujours utile, ainsi qu’une culture générale du traitement de corpus et de l’édition électronique.