About this Course
5,617

100% 온라인

지금 바로 시작해 나만의 일정에 따라 학습을 진행하세요.

탄력적인 마감일

일정에 따라 마감일을 재설정합니다.

초급 단계

완료하는 데 약 22시간 필요

권장: 2 - 3 h/Woche, insg. 6 Wochen...

독일어

자막: 독일어, 영어

귀하가 습득할 기술

Natural Language ProcessingParsingDigital PreservationCorporaNamed-Entity Recognition

100% 온라인

지금 바로 시작해 나만의 일정에 따라 학습을 진행하세요.

탄력적인 마감일

일정에 따라 마감일을 재설정합니다.

초급 단계

완료하는 데 약 22시간 필요

권장: 2 - 3 h/Woche, insg. 6 Wochen...

독일어

자막: 독일어, 영어

강의 계획 - 이 강좌에서 배울 내용

1
완료하는 데 3시간 필요

Woche 1 - Wege in die digitale Welt

In der ersten Woche werden wir darüber sprechen, wie Texte digitalisiert und zum Beispiel in XML dargestellt werden können und was OCR (optical character recognition) für die Anwendung in der Praxis bedeutet. Wir befassen uns außerdem mit der Erstellung von Korpora und den Schwierigkeiten, denen wir dabei begegnen können. Viel Spaß!...
3 videos (Total 49 min), 4 readings, 2 quizzes
3개의 동영상
1.2 - Herausforderungen bei der Korpusakquisition16m
1.3 - Digitalisierungszentrum ZB12m
4개의 읽기 자료
Die Dozenten dieses MOOC's10m
Guidelines zur Bearbeitung des MOOCs10m
Lernziele Modul 15m
Material Modul 110m
2개 연습문제
Was wissen Sie bereits zum Thema Digitalisierung?8m
Testen Sie Ihr Wissen zum Thema Korpusakquisition8m
2
완료하는 데 2시간 필요

Woche 2 - Strukturierte und nachhaltige Repräsentation von Korpusdaten

In der zweiten Woche beschäftigen wir uns mit der strukturierten und nachhaltigen Repräsentation von Korpusdaten. Wir werden über die Markup Language XML sprechen und einige wichtige Standards zur Textrepräsentation kennenlernen. In der zweiten Hälfte dieses Moduls geht es anschließend um das Thema der automatischen Text- und Wortsegmentierung. Viel Spaß mit den Videos!...
2 videos (Total 45 min), 3 readings, 2 quizzes
2개의 동영상
2.2 - Textsegmentierung21m
3개의 읽기 자료
Lernziele Modul 25m
Einführungstext XML: Strukturierte und nachhaltige Repräsentation von Korpusdaten15m
Material Modul 210m
2개 연습문제
XML und TEI P5: Wie viel wissen Sie bereits?12m
Testen Sie Ihr Wissen zum Thema Textsegmentierung6m
3
완료하는 데 4시간 필요

Woche 3 - Eigenschaften von Korpora und grundlegende Analysemethoden

In der dritten Woche geht es um die wichtigsten Eigenschaften von Korpora, um grundlegende Analysemethoden in der Korpuslinguistik und Grundbegriffe wie Worthäufigkeiten, Kollokationen, N-Gramme. Im letzten Teil wird Ihnen Noah Bubenhofer noch einen Ausblick auf die visuelle und graphische Darstellung von Texteigenschaften geben. Viel Spaß!...
3 videos (Total 92 min), 3 readings, 3 quizzes
3개의 동영상
3.2 - Hands-on Korpusanalysen27m
3.3 - Visualisierung und graphische Darstellung32m
3개의 읽기 자료
Lernziele Modul 35m
Visuelle Bergtour durch ein Kollokationsnetz10m
Material Modul 310m
2개 연습문제
Theorie: Grundbegriffe der Korpuslinguistik6m
Praxis: Korpusabfragen und Analysemethoden6m
4
완료하는 데 2시간 필요

Woche 4 - Automatische Korpusannotation mit computerlinguistischen Werkzeugen

In diesem Modul geht es um die automatische Korpus-Annotation mit linguistischen Informationen wie Part-Of-Speech-Tags (Wortarten) und Lemmas (Grundformen), aber auch um die Schwierigkeiten, die eine solche automatische Annotation mit sich bringen kann. Wir werden besprechen, wie die automatische Erkennung von Eigennamen oder geographischen Namen (Named Entities) abläuft und im dritten Teil noch auf die automatische Syntax-Analyse von Texten eingehen. Viel Spaß!...
3 videos (Total 63 min), 3 readings, 2 quizzes
3개의 동영상
4.2 - Erkennung, Klassifikation und Linking von Named Entities17m
4.3 - Syntaktische Analyse16m
3개의 읽기 자료
Lernziele Modul 45m
Named Entities in der Praxis10m
Material Modul 410m
2개 연습문제
Wortarten und Grundformen automatisch bestimmen8m
Testen Sie Ihr Wissen zu NER und Syntaxanalyse10m
5
완료하는 데 3시간 필요

Woche 5 - Manuelle Annotation und Evaluation von Korpusdaten

In Modul 5 beschäftigen wir uns mit der Frage, wie eine möglichst ökonomische Annotation aussehen kann und wie sich manuelle und automatische Annotation mit Hilfe von maschinellem Lernen ergänzen können. Wir besprechen außerdem, wie wir die Qualität bzw. die Genauigkeit der Annotation gewährleisten und evaluieren können. Im zweiten Teil geht es dann um das sogenannte "Crowdsourcing", wo über Online-Plattformen Daten für diverse Projekte gesammelt bzw. korrigiert werden. Viel Spaß in der vorletzten Woche!...
2 videos (Total 52 min), 3 readings, 1 quiz
2개의 동영상
5.2 - Möglichkeiten und Probleme beim Crowdsourcing19m
3개의 읽기 자료
Lernziele Modul 55m
Evaluationsmaße: Wie gut funktioniert unser Modell?10m
Material Modul 510m
6
완료하는 데 3시간 필요

Woche 6 - Herausforderungen der Multilingualen Textanalyse

Im letzten Modul befassen wir uns mit multilingualen bzw. parallelen Korpora. Im ersten Teil geht es um die automatische Sprach-Identifikation in gemischtsprachlichen Korpora, die einen wichtigen Schritt bei der Verarbeitung der Texte darstellt. Im zweiten Teil geht es um die automatische Satz- bzw. Wortalignierung zwischen parallelen Texten in unterschiedlichen Sprachen. Viel Spaß in der letzten Woche!...
2 videos (Total 30 min), 3 readings, 1 quiz
2개의 동영상
6.2 - Sprachübergreifende Alignierung17m
3개의 읽기 자료
Lernziele Modul 65m
Vom Babelfisch zur maschinellen Übersetzung10m
Material Modul 610m
1개 연습문제
Fast geschafft: Sprachidentifikation & Alignierung12m
4.8
3개의 리뷰Chevron Right

최상위 리뷰

대학: DHNov 19th 2017

Sehr gut strukturierter Kurs! Man lernt viele aktuelle Methoden, Begriffe und Tools kennen, die man in dne unterschiedlichsten Projekten anwenden kann! Ein zeitnaher Kurs zu einem spannenden Thema!

대학: PMFeb 18th 2019

Exzellenter Kurs, auf einige Dozentenschultern abgestützt, sehr lehrreich und interessant.

강사

Avatar

Martin Volk

Prof. Dr.
Institute of Computational Linguistics
Avatar

Noah Bubenhofer

Dr.
Institute of Computational Linguistics
Avatar

Simon Clematide

Dr. phil.
Institute of Computational Linguistics

취리히 대학교 정보

Founded in 1833, the University of Zurich (UZH) is Switzerland’s largest university, with a cur­rent enrollment of over 26,000 students. Made up of seven faculties covering approximately 100 different subject areas, UZH is proud to offer the most comprehensive aca­demic program in the country....

자주 묻는 질문

  • 강좌에 등록하면 바로 모든 비디오, 테스트 및 프로그래밍 과제(해당하는 경우)에 접근할 수 있습니다. 상호 첨삭 과제는 이 세션이 시작된 경우에만 제출하고 검토할 수 있습니다. 강좌를 구매하지 않고 살펴보기만 하면 특정 과제에 접근하지 못할 수 있습니다.

  • 수료증을 구매하면 성적 평가 과제를 포함한 모든 강좌 자료에 접근할 수 있습니다. 강좌를 완료하면 전자 수료증이 성취도 페이지에 추가되며, 해당 페이지에서 수료증을 인쇄하거나 LinkedIn 프로필에 수료증을 추가할 수 있습니다. 강좌 콘텐츠만 읽고 살펴보려면 해당 강좌를 무료로 청강할 수 있습니다.

궁금한 점이 더 있으신가요? 학습자 도움말 센터를 방문해 보세요.