Liczba odwiedzin: 9565
» O Korpusie
Copyright © Pracownia Edytorstwa Źródeł i Humanistyki Cyfrowej AL UW

Wszelkie prawa zastrzeżone. Zabrania się kopiowania, redystrybucji, publikowania, rozpowszechniania, udostępniania czy wykorzystywania w inny sposób całości lub części danych zawartych na stronie Pracowni bez pisemnej zgody właściciela praw.

Internetowa publikacja Korpusu Tekstów i Korespondencji Jana Dantyszka (1485-1548)
informacja o projekcie



Autorzy
Anna Skolimowska (kierownik projektu) i Magdalena Turska
przy współpracy Katarzyny Jasińskiej-Zdun


Transkrypcje z rękopisu
Tatiana Abukhouskaya, Marijke De Wit, Angelina Gerus, Joanna Gutek, Justyna Jadachowska, Katarzyna Jasińska-Zdun, Konrad Kokoszkiewicz, Tomasz Ososiński, Paulina Pludra-Żuk, Patryk Sapała, Giulia Simonini, Anna Skolimowska, Katarzyna Tomaszuk, Isabella Żołędziowska

Kodowanie tekstu
Katarzyna Gołąbek, Katarzyna Jasińska-Zdun, Anna Skolimowska, Katarzyna Tomaszuk, Isabella Żołędziowska,

Opracowanie wersji cyfrowej mikrofilmów źródeł prymarnych
Witold Grzechnik

Indeks nazw osobowych, geograficznych i instytucji opracowano przy współpracy Marka A. Janickiego i Katarzyny Gołąbek.

Autorzy będą wdzięczni użytkownikom edycji za zgłaszanie opinii, uwag krytycznych i dostrzeżonych błędów.
Autorzy pragną w tym miejscu wyrazić podziękowania właścicielom źródeł prymarnych do tekstów, którzy wyrazili zgodę na prezentację podobizn źródeł w internecie.

Spis treści

Wstęp

Projekt „Internetowa publikacja Korpusu Tekstów i Korespondencji Jana Dantyszka (1485-1548)” jest częścią programu badawczego „Rejestracja i publikacja korespondencji Jana Dantyszka (1485-1548)”, realizowanego od roku 1989 w Uniwersytecie Warszawskim. Korespondencja Jana Dantyszka stanowi największy w Europie Środkowowschodniej zbiór listów (ponad 6 000 listów, ok. 12 000 dokumentów źródłowych), powstały w kręgu dworu polskiego i jego partnerów w całym ówczesnym świecie. Jest to unikalne źródło informacji dla badaczy polskiej i europejskiej historii, literatury, kultury i historii idei okresu Renesansu. Dokumentuje ono rolę Polski i polskiej dyplomacji w renesansowej Europie oraz przynosi cenne informacje o ówczesnych elitach kulturalnych i intelektualnych, które łączyła wspólnota formacji duchowej, wyznaczanej przez łacińskość (Latinitas) i religię chrześcijańską (Christianitas).

Publikację korespondencji Dantyszka postulowano wielokrotnie już od XVIII w., jednak ogrom zróżnicowanego paleograficznie materiału rękopiśmiennego i jego rozproszenie po archiwach i bibliotekach całej Europy uniemożliwiały realizację tych postulatów. Przed pierwszą publikacją Korpusu Tekstów i Korespondencji Jana Dnatyszka w internecie(2010) ok. 30% listów funkcjonowało w obiegu naukowym dzięki rozmaitym drukowanym wydawnictwom źródłowym (najważniejsze z nich to Acta Tomiciana, Stanislai Hosii Epistulae, Herzog Albrecht von Preussen und das Bistum Ermland), oraz jako aneksy do opracowań naukowych. Część tych edycji prezentuje tylko streszczenia lub przekłady tekstu źródłowego, niektóre, zwłaszcza te dawniejsze, nie przedstawiają sobą większej wartości jako edycje naukowe. Fragmentaryczność i rozproszenie tych publikacji sprawiają, że niezbędne jest zebranie i usystematyzowanie informacji o nich w ramach inwentarza całości korespondencji. Inwentarze tego typu są sprawdzonym już w edytorstwie europejskim wstępem do publikacji zbiorów korespondencji renesansowej (np. inwentarz korespondencji Justusa Lipsiusa czy też publikacja regestów korespondencji Filipa Melanchtona).

Szczegółowe informacje o projekcie

Kodowanie tekstu w standardzie TEI

Podczas prac nad edycją internetową Korpusu Tekstów i Korespondencji Jana Dantyszka wykorzystano nowoczesną metodę kodowania tekstu w standardzie TEI, który umożliwia zapisanie tekstu wraz z informacjami dotyczącymi jego treści i struktury na różnych poziomach, zawarcie w czytelnym formacie tekstowym cech bazy danych, łatwy eksport i import danych do innych systemów ze względu na powszechność obsługi formatu XML we współczesnych systemach informatycznych oraz łatwe przejście z takiego formatu do publikacji elektronicznej, m.in. w formie stron www. Zespół badawczy pracujący nad projektem opracował zgodny zTEI system anotacji na potrzeby edycji korespondencji wczesnonowożytnej.

Zawartość

Obecnie Korpus Tekstów i Korespondencji Jana Dantyszka zawiera dane inwentarzowe dotyczące całej korespondencji Dantyszka (nadawca, adresat, incipit, datacja, dane o podstawie źródłowej, dane o publikacjach drukiem) oraz wszystkie teksty pióra Dantyszka (listy, wiersze, mowy, dokumenty, inne teksty ) zebrane w Korpusie Tekstów Łacińskich oraz w Korpusie Tekstów Niemieckich Jana Dantyszka, a także wybór listów do Dantyszka. Wybór ten uzależniony jest od potrzeb badawczych całego programu. Sukcesywnie dodawane są transkrypcje kolejnych listów. W przyszłości planowana jest publikacja wszystkich listów w wersji pełnotekstowej.

Aby nie opóźniać realizacji głównego celu edycji internetowej, jakim jest udostępnienie przeszukiwalnego tekstu, zdecydowano się na publikację materiałów opracowanych od strony edytorskiej (aparat krytyczny), nawet jeżeli nie zostały one jeszcze opatrzone pełnym komentarzem rzeczowym i indeksami. Komentarz i indeksy są uzupełniane na bieżąco.

Układ tekstów

Wszystkie teksty Korpusu oraz wszystkie źródła do tekstów otrzymały numery identyfikacyjne.

Numery rozpoczynające się od skrótu IDL odnoszą się do listów z korespondencji Dantyszka.

Numery rozpoczynające się od skrótu IDP odnoszą się do wierszy Dantyszka.

Numery rozpoczynające się od skrótu IDT odnoszą się do wszystkich pozostałych tekstów.

Numery rozpoczynające się od skrótu IDS odnoszą się do źródeł (rękopiśmiennych i starych druków).

Korpus prezentowany jest na trzech poziomach:

1. Spis tekstów zawiera podstawowe informacje o tekście, np. w wypadku listu są to: nadawca, adresat, miejsce i data nadania, w wypadku mowy – mocodawca, adresat i data wygłoszenia, w wypadku wiersza – tytuł wiersza i/lub jego incipit, itp.

2. Baza danych o tekstach oprócz danych ze spisu tekstów zawiera incipit tekstu, w przypadku listu – datę i miejsce odebrania, dane o podstawie źródłowej, dane o publikacjach drukiem.

3. Baza danych o tekstach + teksty in extenso + podobizny źródeł prymarnych.

Dwa pierwsze poziomy – Spis tekstów i Baza danych o tekstach – udostępniane są bez ograniczeń.

Dostęp do tekstów in extenso oraz do podobizn źródeł obwarowany jest koniecznością zalogowania się i uzyskania hasła.

Domyślnym układem tekstów jest układ chronologiczny. Teksty niedatowane umieszczono na końcu. Teksty datowane w przybliżeniu umieszczono wg terminus ante quem. Planowane jest umożliwienie sortowania tekstów wg innych kryteriów, takich jak tytuł, autor, adresat, miejsce powstania tekstu, incipit, miejsce przechowywania itp.

Teksty, których źródło prymarne obejmuje więcej niż jedną stronę rękopisu lub starego druku, podzielono na fragmenty odpowiadające podziałowi stron źródła prymarnego. Podział ten nie dotyczy wierszy.

Zakres udostępnienia poszczególnych tekstów źródłowych sygnalizują następujące oznaczenia graficzne:

  • - metadane tekstu
  • - wersja pełnotekstowa
  • - faksymile źródła prymarnego

Zapis tekstu

Łacina

Pisownia podstawy źródłowej tekstów łacińskich nie została zachowana. Zdecydowano się na standaryzację ortografii według zasad tradycyjnie stosowanych w edycjach źródeł nowożytnych w Europie Centralnej np. w sztutgarckiej edycji korespondencji Filipa Melanchtona (Melanchthons Briefwechsel: Kritische und kommentierte Gesamtasugabe, red. Heinz Scheible et al., Stuttgart-Bad Cannstatt 1977-)

Ponieważ łacina w odróżnieniu od języków wernakularnych rozwija się w okresie nowożytnym w bardzo ograniczonym zakresie, uznano, że standaryzacja przyniesie tu więcej korzyści niż transliteracja tekstu, której główną zaletą jest dokumentowanie zjawisk językowych.

Decyzja o standaryzacji została podyktowana z jednej strony troską o przejrzystość tekstu i jego przeszukiwalność, z drugiej strony – brakiem możliwości ustalenia autorskiej wizji formy graficznej tekstu w przypadku źródeł, które nie są czystopisami, w przypadku czystopisów zaś – częstym brakiem konsekwentnego zapisu.

Rozważano wprowadzenie do Korpusu drugiej warstwy tekstu – transliteracji źródła prymarnego, w przypadku tekstów łacińskich wycofano się jednak z tego pomysłu, ponieważ jego realizacja wiązałaby się z koniecznością rewizji dużej ilości tekstu transkrybowanego wcześniej według innych zasad , przyjętych początkowo podczas przygotowywania książkowej edycji serii Corpus Epistularum Ioannis Dantisci . Aby jednak umożliwić Użytkownikom zapoznanie się z zewnętrzną postacią źródła oraz konfrontację transkrypcji z zapisem źródłowym, do Korpusu dołączono podobizny wszystkich źródeł prymarnych korespondencji, których właściciele wyrazili zgodę na prezentację źródła w internecie.

Szczegółowe zasady standaryzacji

  • zapis wg zasad łaciny starożytnej grupy fonetycznej ti, dyftongów ae, oe, oraz geminat
  • fonetyczne zróżnicowanie między literami u (samogloska) i v (spółgłoska) (np. vitium, universum)
  • niestosowanie litery j (np. Ioannes, ieiunium, alii)
  • niestosowanie liter ii oraz y na oznaczenie długiego i (np. sincerus, ocissime)
  • niestosowanie zapisu ch w miejsce starożytnego c (np. carus)
  • niestosowanie zapisu ch w miejsce starożytnego h (np. mihi, nihil)
  • asymilacja wsteczna końcowych spółgłosek prefiksów w czasownikach złożonych
  • zachowanie litery s po przedimku ex- (np. exspecto)
  • pominięcie aspirantu h w wyrazach, które nie były aspirowane w starożytności (np. abundantia)

Według powyższych zasad ujednolicano również te nazwy własne (głównie miejscowe), w których przypadku istnieje rozpowszechniona łacińska pisownia. Nie ujednolicano grafii w następujących przypadkach:

  • imiona i nazwy własne niełacińskie podano w transliteracji
  • fragmenty tekstu w językach wernakularnych podano w transliteracji
  • zachowano pisownię cyfr rzymskich i arabskich, przy czym wszystkie cyfry rzymskie zapisano majuskułą

Wszystkie skróty występujące w tekście łacińskim rozwiązano bez zaznaczania, z wyjątkiem miejsc dwuznacznych lub wątpliwych, w których przypadku zastosowano nawias okrągły ( ), a w razie potrzeby umieszczono komentarz w aparacie krytycznym.

W przypadku form obocznych występujących w starożytności podjęto rozstrzygnięcia arbitralne, kierując się tym przede wszystkim funkcjonowaniem danej formy w epoce nowożytnej.

Zestawienie ważniejszych oboczności starożytnych
forma zastosowana w CIDTCforma oboczna
adolescensadulescens
aliquotiesaliquotiens
cartacharta
cotidiecottidie, quotidie, quottidie
cumquum
złożenia z -cumque (np. utcumque, quocumque)-cunque
dirigoderigo
epistulaepistola
exiliumexsilium
harenaarena
humerusumerus
końcówka -i w ablativie (egnp. superiori, veteri)końcówka -e w ablativeie (np. superiore, vetere)
idcircoiccirco
immoimo
inclitusinclutus
intelligointellego
negligoneglego
numquamnunquam
oportunitas, oportunusopportunitas, opportunus
retulirettuli
strenuestrennue
tamquamtanquam
tempto (i złożenia)tento
umquamunquam

Język niemiecki

Przy opracowywaniu tekstów niemieckich przyjęto zasadę transkrypcji z elementami transliteracji, tak aby korpus mógł służyć zarówno do badań historycznych, jak i językowych.

Rozważane jest również wprowadzenie w przyszłości lemmatyzacji wszystkich słów Korpusu Tekstów Niemieckich Jana Dantyszka w celu uzyskania przeszukiwalnej warstwy Korpusu.

Zasady transkrypcji opracowano w oparciu o następujące publikacje:

  • Johannes SCHULZE, Richtlinien für die äußere Textgestaltung bei Herausgabe von Quellen zur neueren deutschen Geschichte, w: Blätter für deutsche Landesgeschichte 98, 1962, s. 1-11
  • „Empfehlungen zur Edition frühneuzeitlicher Texte“, erarbeitet von der Arbeitsgemeinschaft außeruniversitärer historischer Forschungseinrichtungen, w: Archiv für Reformationsgeschichte 72, 1981, s. 299-315
  • Bernard BARBICHE, „Conseils pour l’édition des textes de l’époque moderne“, w: L’édition des textes anciens XVIe-XVIIIe siècle, red. B. BARBICHE, M. CHATENET, Paris, 1991
  • Dieter HECKMANN, Entwurf eines Leitfadens zur Edition deutschsprachiger Quellen (13.-16. Jh.) (25. Juli 2000; Stand: 17. September 2010).

W ramach transkrypcji zastosowano przyjęte powszechnie standardy normalizacji:

  • Allografy s i ſ oddano za pomocą s.
  • Litery u i v oraz i i j są stosowane zgodnie z ich wartością fonetyczną – u i i jako samogłoski, v i j jako spółgłoski

Zasady te nie obowiązują dla imion i nazw własnych, które podano w transliteracji.

Zwielokrotnienia spółgłosek oddano zgodnie z oryginałem, ponieważ mogą być wartościowe dla badań językoznawczych. Dotyczy to również podwójnych spółgłosek na początku wyrazu.

Ligatury zostały rozwiązane bez komentarza.

Zachowano znaki diakrytyczne i litery nadpisane nad samogłoskami. Kropka nad i oraz haczyk nad u zostały potraktowane jako części litery i nie zaznaczane dodatkowo w transliteracji.

Zachowano łączną lub rozdzielną pisownię wyrazów zgodnie z formą zastaną w źródle. W przypadku, kiedy trudno określić, czy odstęp między słowami istnieje, przyjęto pisownię ułatwiającą zrozumienie tekstu.

Wielką literą rozpoczynamy wyrazy na początku zdania, nazwy własne i imiona.

Wszystkie skróty rozwiązano w nawiasach okrągłych. W związku z chwiejnością szesnastowiecznej ortografii, w przypadku różnych wariantów rozwiązania skrótu uwzględniono indywidualne przyzwyczajenia osoby piszącej. Jeśli baza źródłowa do ich ustalenia była zbyt mała, zastosowano zasady powszechne w tamtym czasie i środowisku. Przy wątpliwościach podano wszystkie uwzględniane rozwiązania.

Ewidentne opuszczenia, formy odmienne od stosowanych w pozostałych listach lub zmieniające znaczenie słowa tak, że nie zgadza się ono z kontekstem, uznano za błędy piszącego i poprawiono, sygnalizując je w aparacie krytycznym (patrz także punkt „zastosowane nawiasy i znaki graficzne”).

Pozostałe języki wernakularne

Obok listów łacińskich i niemieckich w korespondencji Dantyszka pojawiają się także (w niewielkiej liczbie) listy hiszpańskie, polskie, włoskie, flamandzkie, czeskie i francuskie.

W przypadku tekstów hiszpańskich, włoskich, flamandzkich, czeskich i francuskich zdecydowano się zastosować transliterację, teksty polskie natomiast oddano w transkrypcji. Wszystkie skróty zostaly rozwiązane w nawiasach okrągłych.

Interpunkcja

Do tekstu wprowadzono współczesną interpunkcję, tak jednak, aby nie pozostawała ona w sprzeczności z interpunkcją szesnastowiecznych przekazów źródłowych. Zazwyczaj zachowano nawiasy i znaki zapytania wprowadzone przez autora. W tekstach niemieckich po zapisanych cyframi liczebnikach porządkowych postawiono kropkę.

W przypadku tekstów niemieckich obok interpunkcji współczesnej pozostawiono także interpunkcję źródła, którą oznaczono przy pomocy virguli.

Podzielono tekst na akapity zgodnie z obserwowanymi w przekazach źródłowych przesłankami graficznymi.

Wprowadzono współczesne zasady stosowania wielkich liter. Obficie występująca w tekście listów tytulatura rozpoczynana jest małą literą, z wyjątkiem zwrotów do adresatów, do których nadawca pisze w trzeciej osobie.

Zastosowane nawiasy i znaki graficzne:

  • • Nawias okrągły ( ) – nawiasy autora tekstu, niepewności przy rozwiązaniu skrótu
  • • Nawias kwadratowy [ ] – luki w tekście, wynikłe z uszkodzenia przekazu źródłowego - wewnątrz wielokropek, ew. koniektura wydawcy
  • • Nawias ostry < > – uzupełnienia wydawcy, nie wynikające z fizycznego zniszczenia podstawy źródłowej, niezbędne do zrozumienia tekstu
  • • Nawias klamrowy: {} – fragmenty tekstu, które wydawca uważa za zbędne (np. nieumyślne powtórzenia wyrazu)

Skreślone partie tekstu

W bardzo wielu przypadkach źródłem prymarnym do listu jest brulion. Cechą tego rodzaju źródeł są liczne poprawki autorskie, nanoszone na tworzonym tekście. Poprawki te zostały w miarę możliwości zarejestrowane. Partie tekstu skreślone podczas redagowania uwidoczniono w tekście edycji w postaci zapisu przekreślonego, np. dominus.

Komentarz

Tekst opatrzono aparatem krytycznym, odnoszącym sie przede wszystkim do źródeł prymarnych, a w uzasadnionych przypadkach także do sekundarnych.

Komentarz rzeczowy oraz identyfikacja similiów są nadal opracowywane i aktualizowane na bieżąco. W edycji fragmenty tekstu, do których odnosi się aparat krytyczny, zostały wyróżnione jaśniejszym kolorem czcionki, similia zostały podświetlone na żółto, a komentarz rzeczowy – na szaro. Tekst komentarza pojawia się po wskazaniu myszką wyróżnionego fragmentu. Dodatkowo fragmenty tekstu, do których odnosisię aparat krytyczny zostały otoczone oznaczeniami ⌈ ⌉, similia i komentarz rzeczowy zaś – oznaczeniami ⌊ ⌋.

Indeksy

Indeksy pozostają w trakcie opracowywania. Aktualizacje są publikowane na bieżąco. Jedynie spisy nadawców i adresatów oraz miejsc nadania i odebrania listów a także miejsc napisania innych tekstów (z wyjątkiem wierszy) są kompletne.

Indeksy obejmują osoby, grupy osób, instytucje i miejsca wymienione w tekście, zarówno te występujące pod nazwą własną, jak i określone opisowo (także zaimkiem). Spis wystąpień odnosi się do numeru identyfikacyjnego tekstu. Numery rozpoczynające się od skrótu IDL odnoszą się do listów z korespondencji Dantyszka, od skrótu IDP – do wierszy Dantyszka, od skrótu IDT – do wszystkich pozostałych tekstów.

Indeksy obejmują teksty źródłowe oraz przypisy rzeczowe, z pominięciem autorów, tytułów i miejsc publikacji przytaczanych pozycji bibliograficznych. Uwzględniono najważniejsze i najczęściej spotykane oraz wybrane współczesne warianty nazw osobowych i geograficznych. Nazwy instytucji (z wyjątkiem niektórych zakonów i związków) powiązanych z miejscem podano pod nazwą miasta, państwa lub krainy, w której funkcjonowały. Warianty nazw w języku łacińskim podano kursywą.

Jako formę prymarną, do której odsyłają wszystkie pozostałe warianty, przyjęto formę używaną tradycyjnie w anglojęzycznej literaturze naukowej. Przy wyborze formy prymarnej oparto się przede wszystkim na przesłankach historycznych i językowych, w mniejszym stopniu zaś wzięto pod uwagę współczesne nazwy etniczne lub narodowe. Jako formy prymarne wybrano zatem te najczęściej i najszerzej używane, potwierdzone źródłowo oraz stosowane w historiografii dotyczącej epoki. W przypadku nazw geograficznych miast położonych w dawnych Prusach Królewskich (z wyjątkiem Gdańska) i na Warmii zastosowano historyczne formy niemieckie.

Wkrótce będzie możliwe uzyskiwanie wyniku wyszukiwania w indeksach w formie konkordancji, wyświetlającej terminy źródłowe określające dany obiekt, otoczone większą partią tekstu (minimum 1 zdanie). W tym celu oznaczano pierwsze wystąpienie danego obiektu w każdym zdaniu tekstu. Określenia odnoszące się do autorów (w przypadku listów – nadawców) i adresatów tekstów oznaczano wyłącznie w adresach i podpisach, a w wypadku braku adresu lub podpisu – w formułach alokucji.