Akquisition komplexer Lexeme aus Textkorpora / / Lothar Lemnitzer.
Aus der Verfügbarkeit großer Textkorpora ergeben sich für die maschinelle Sprachverarbeitung, für die Lexikographie und für das Information Retrieval neue Perspektiven. In dieser Arbeit werden Möglichkeiten aufgezeigt, mit Hilfe statistischer Verfahren zu verläßlichen Aussagen über die Existenz komp...
Saved in:
Superior document: | Title is part of eBook package: De Gruyter DGBA Linguistics and Semiotics 1990 - 1999 |
---|---|
VerfasserIn: | |
Place / Publishing House: | Tübingen : : Max Niemeyer Verlag, , [2011] Max Niemeyer Verlag, , [1997] ©1997 |
Year of Publication: | 2011 1997 |
Edition: | Reprint 2010 |
Language: | German |
Series: | Reihe Germanistische Linguistik ,
180 |
Online Access: | |
Physical Description: | 1 online resource (258 p.) |
Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
id |
9783110927986 |
---|---|
ctrlnum |
(DE-B1597)45823 (OCoLC)979637138 |
collection |
bib_alma |
record_format |
marc |
spelling |
Lemnitzer, Lothar, author. aut http://id.loc.gov/vocabulary/relators/aut Akquisition komplexer Lexeme aus Textkorpora / Lothar Lemnitzer. Reprint 2010 Tübingen : Max Niemeyer Verlag, [2011] Max Niemeyer Verlag, [1997] ©1997 1 online resource (258 p.) text txt rdacontent computer c rdamedia online resource cr rdacarrier text file PDF rda Reihe Germanistische Linguistik , 0344-6778 ; 180 I-X -- 1 Einleitung -- I Hintergrund -- 2 Lexikon, Text und Grammatik -- 3 Lexikalische und textuelle Zeichen -- II Korpusanalyse -- 4 Gegenstand und Methoden der Untersuchung -- 5 Fallstudien -- 6 Das Computerlexikon von morgen -- III Anhang -- 7 Literatur -- 8 Glossar -- 9 Häufigkeitslisten -- 10 MLexD-Formalismus -- 11 Document Type Definition für die FAZ-Zeitungsartikel restricted access http://purl.org/coar/access_right/c_16ec online access with authorization star Aus der Verfügbarkeit großer Textkorpora ergeben sich für die maschinelle Sprachverarbeitung, für die Lexikographie und für das Information Retrieval neue Perspektiven. In dieser Arbeit werden Möglichkeiten aufgezeigt, mit Hilfe statistischer Verfahren zu verläßlichen Aussagen über die Existenz komplexer lexikalischer Einheiten zu kommen. Zu diesen Lexikoneinheiten zählen Funktionswörter ebenso wie Kollokationen und feste Wendungen. Grundlage der Untersuchungen sind Textkorpora des Deutschen. Bei der Bewertung der Güte verschiedener statistischer Verfahren zeigt es sich, daß die Wahl eines Verfahrens von der konkreten Aufgabe abhängig ist. Anhand dreier Fallstudien - Abtönungspartikeln, Verbpartikeln und Pronomen - wird anschaulich dargelegt, welcher Erkenntnisgewinn für die lexikalische Arbeit aus der Wahl des geeigneten statistischen Verfahrens zu ziehen ist. Für die maschinelle Sprachverarbeitung und das Computerlexikon von morgen folgt, daß korpusgestützte lexikalische Arbeit fruchtbringender ist als die systematische Auswertung gedruckter Wörterbücher. Es wird auch gezeigt, wie orthographisch komplexe Lexikoneinheiten angemessen in einem Computerlexikon repräsentiert werden können. Mit einem um komplexe Einheiten bereicherten Lexikon sind auch Probleme der Worterkennung beim Information Retrieval und in der Lexikostatistik besser zu meistern. The availability of extensive text corpora opens up new vistas for computer language processing and lexicography. This study points up ways of using statistic procedures to arrive at reliable statements on complex lexical units on the basis of their recurrent incidence in text corpora. Various statistic approaches are discussed and their quality compared. Finally, three case studies (taken from German-language corpora) are presented to demonstrate the potentialities and limitations displayed by machine acquisition of complex lexical units. Issued also in print. Mode of access: Internet via World Wide Web. In German. Description based on online resource; title from PDF title page (publisher's Web site, viewed 28. Feb 2023) LANGUAGE ARTS & DISCIPLINES / Linguistics / General. bisacsh Title is part of eBook package: De Gruyter DGBA Linguistics and Semiotics 1990 - 1999 9783110636895 ZDB-23-DLS print 9783484311800 https://doi.org/10.1515/9783110927986 https://www.degruyter.com/isbn/9783110927986 Cover https://www.degruyter.com/document/cover/isbn/9783110927986/original |
language |
German |
format |
eBook |
author |
Lemnitzer, Lothar, Lemnitzer, Lothar, |
spellingShingle |
Lemnitzer, Lothar, Lemnitzer, Lothar, Akquisition komplexer Lexeme aus Textkorpora / Reihe Germanistische Linguistik , I-X -- 1 Einleitung -- I Hintergrund -- 2 Lexikon, Text und Grammatik -- 3 Lexikalische und textuelle Zeichen -- II Korpusanalyse -- 4 Gegenstand und Methoden der Untersuchung -- 5 Fallstudien -- 6 Das Computerlexikon von morgen -- III Anhang -- 7 Literatur -- 8 Glossar -- 9 Häufigkeitslisten -- 10 MLexD-Formalismus -- 11 Document Type Definition für die FAZ-Zeitungsartikel |
author_facet |
Lemnitzer, Lothar, Lemnitzer, Lothar, |
author_variant |
l l ll l l ll |
author_role |
VerfasserIn VerfasserIn |
author_sort |
Lemnitzer, Lothar, |
title |
Akquisition komplexer Lexeme aus Textkorpora / |
title_full |
Akquisition komplexer Lexeme aus Textkorpora / Lothar Lemnitzer. |
title_fullStr |
Akquisition komplexer Lexeme aus Textkorpora / Lothar Lemnitzer. |
title_full_unstemmed |
Akquisition komplexer Lexeme aus Textkorpora / Lothar Lemnitzer. |
title_auth |
Akquisition komplexer Lexeme aus Textkorpora / |
title_alt |
I-X -- 1 Einleitung -- I Hintergrund -- 2 Lexikon, Text und Grammatik -- 3 Lexikalische und textuelle Zeichen -- II Korpusanalyse -- 4 Gegenstand und Methoden der Untersuchung -- 5 Fallstudien -- 6 Das Computerlexikon von morgen -- III Anhang -- 7 Literatur -- 8 Glossar -- 9 Häufigkeitslisten -- 10 MLexD-Formalismus -- 11 Document Type Definition für die FAZ-Zeitungsartikel |
title_new |
Akquisition komplexer Lexeme aus Textkorpora / |
title_sort |
akquisition komplexer lexeme aus textkorpora / |
series |
Reihe Germanistische Linguistik , |
series2 |
Reihe Germanistische Linguistik , |
publisher |
Max Niemeyer Verlag, |
publishDate |
2011 1997 |
physical |
1 online resource (258 p.) Issued also in print. |
edition |
Reprint 2010 |
contents |
I-X -- 1 Einleitung -- I Hintergrund -- 2 Lexikon, Text und Grammatik -- 3 Lexikalische und textuelle Zeichen -- II Korpusanalyse -- 4 Gegenstand und Methoden der Untersuchung -- 5 Fallstudien -- 6 Das Computerlexikon von morgen -- III Anhang -- 7 Literatur -- 8 Glossar -- 9 Häufigkeitslisten -- 10 MLexD-Formalismus -- 11 Document Type Definition für die FAZ-Zeitungsartikel |
isbn |
9783110927986 9783110636895 9783484311800 |
issn |
0344-6778 ; |
callnumber-first |
P - Language and Literature |
callnumber-subject |
PF - West Germanic Languages |
callnumber-label |
PF3611 |
callnumber-sort |
PF 43611 L45 41997 |
url |
https://doi.org/10.1515/9783110927986 https://www.degruyter.com/isbn/9783110927986 https://www.degruyter.com/document/cover/isbn/9783110927986/original |
illustrated |
Not Illustrated |
dewey-hundreds |
400 - Language |
dewey-tens |
430 - German & related languages |
dewey-ones |
433 - German dictionaries |
dewey-full |
433.028 |
dewey-sort |
3433.028 |
dewey-raw |
433.028 |
dewey-search |
433.028 |
doi_str_mv |
10.1515/9783110927986 |
oclc_num |
979637138 |
work_keys_str_mv |
AT lemnitzerlothar akquisitionkomplexerlexemeaustextkorpora |
status_str |
n |
ids_txt_mv |
(DE-B1597)45823 (OCoLC)979637138 |
carrierType_str_mv |
cr |
hierarchy_parent_title |
Title is part of eBook package: De Gruyter DGBA Linguistics and Semiotics 1990 - 1999 |
is_hierarchy_title |
Akquisition komplexer Lexeme aus Textkorpora / |
container_title |
Title is part of eBook package: De Gruyter DGBA Linguistics and Semiotics 1990 - 1999 |
_version_ |
1806144840960835584 |
fullrecord |
<?xml version="1.0" encoding="UTF-8"?><collection xmlns="http://www.loc.gov/MARC21/slim"><record><leader>04690nam a22006615i 4500</leader><controlfield tag="001">9783110927986</controlfield><controlfield tag="003">DE-B1597</controlfield><controlfield tag="005">20230228015514.0</controlfield><controlfield tag="006">m|||||o||d||||||||</controlfield><controlfield tag="007">cr || ||||||||</controlfield><controlfield tag="008">230228t20111997gw fo d z ger d</controlfield><datafield tag="019" ind1=" " ind2=" "><subfield code="a">(OCoLC)1049636806</subfield></datafield><datafield tag="020" ind1=" " ind2=" "><subfield code="a">9783110927986</subfield></datafield><datafield tag="024" ind1="7" ind2=" "><subfield code="a">10.1515/9783110927986</subfield><subfield code="2">doi</subfield></datafield><datafield tag="035" ind1=" " ind2=" "><subfield code="a">(DE-B1597)45823</subfield></datafield><datafield tag="035" ind1=" " ind2=" "><subfield code="a">(OCoLC)979637138</subfield></datafield><datafield tag="040" ind1=" " ind2=" "><subfield code="a">DE-B1597</subfield><subfield code="b">eng</subfield><subfield code="c">DE-B1597</subfield><subfield code="e">rda</subfield></datafield><datafield tag="041" ind1="0" ind2=" "><subfield code="a">ger</subfield></datafield><datafield tag="044" ind1=" " ind2=" "><subfield code="a">gw</subfield><subfield code="c">DE</subfield></datafield><datafield tag="050" ind1=" " ind2="4"><subfield code="a">PF3611 .L45 1997</subfield></datafield><datafield tag="072" ind1=" " ind2="7"><subfield code="a">LAN009000</subfield><subfield code="2">bisacsh</subfield></datafield><datafield tag="082" ind1="0" ind2="4"><subfield code="a">433.028</subfield></datafield><datafield tag="084" ind1=" " ind2=" "><subfield code="a">ES 965</subfield><subfield code="2">rvk</subfield><subfield code="0">(DE-625)rvk/27939:</subfield></datafield><datafield tag="100" ind1="1" ind2=" "><subfield code="a">Lemnitzer, Lothar, </subfield><subfield code="e">author.</subfield><subfield code="4">aut</subfield><subfield code="4">http://id.loc.gov/vocabulary/relators/aut</subfield></datafield><datafield tag="245" ind1="1" ind2="0"><subfield code="a">Akquisition komplexer Lexeme aus Textkorpora /</subfield><subfield code="c">Lothar Lemnitzer.</subfield></datafield><datafield tag="250" ind1=" " ind2=" "><subfield code="a">Reprint 2010</subfield></datafield><datafield tag="264" ind1="3" ind2="1"><subfield code="a">Tübingen : </subfield><subfield code="b">Max Niemeyer Verlag, </subfield><subfield code="c">[2011]</subfield></datafield><datafield tag="264" ind1=" " ind2="1"><subfield code="b">Max Niemeyer Verlag, </subfield><subfield code="c">[1997]</subfield></datafield><datafield tag="264" ind1=" " ind2="4"><subfield code="c">©1997</subfield></datafield><datafield tag="300" ind1=" " ind2=" "><subfield code="a">1 online resource (258 p.)</subfield></datafield><datafield tag="336" ind1=" " ind2=" "><subfield code="a">text</subfield><subfield code="b">txt</subfield><subfield code="2">rdacontent</subfield></datafield><datafield tag="337" ind1=" " ind2=" "><subfield code="a">computer</subfield><subfield code="b">c</subfield><subfield code="2">rdamedia</subfield></datafield><datafield tag="338" ind1=" " ind2=" "><subfield code="a">online resource</subfield><subfield code="b">cr</subfield><subfield code="2">rdacarrier</subfield></datafield><datafield tag="347" ind1=" " ind2=" "><subfield code="a">text file</subfield><subfield code="b">PDF</subfield><subfield code="2">rda</subfield></datafield><datafield tag="490" ind1="0" ind2=" "><subfield code="a">Reihe Germanistische Linguistik ,</subfield><subfield code="x">0344-6778 ;</subfield><subfield code="v">180</subfield></datafield><datafield tag="505" ind1="0" ind2="0"><subfield code="t">I-X -- </subfield><subfield code="t">1 Einleitung -- </subfield><subfield code="t">I Hintergrund -- </subfield><subfield code="t">2 Lexikon, Text und Grammatik -- </subfield><subfield code="t">3 Lexikalische und textuelle Zeichen -- </subfield><subfield code="t">II Korpusanalyse -- </subfield><subfield code="t">4 Gegenstand und Methoden der Untersuchung -- </subfield><subfield code="t">5 Fallstudien -- </subfield><subfield code="t">6 Das Computerlexikon von morgen -- </subfield><subfield code="t">III Anhang -- </subfield><subfield code="t">7 Literatur -- </subfield><subfield code="t">8 Glossar -- </subfield><subfield code="t">9 Häufigkeitslisten -- </subfield><subfield code="t">10 MLexD-Formalismus -- </subfield><subfield code="t">11 Document Type Definition für die FAZ-Zeitungsartikel</subfield></datafield><datafield tag="506" ind1="0" ind2=" "><subfield code="a">restricted access</subfield><subfield code="u">http://purl.org/coar/access_right/c_16ec</subfield><subfield code="f">online access with authorization</subfield><subfield code="2">star</subfield></datafield><datafield tag="520" ind1=" " ind2=" "><subfield code="a">Aus der Verfügbarkeit großer Textkorpora ergeben sich für die maschinelle Sprachverarbeitung, für die Lexikographie und für das Information Retrieval neue Perspektiven. In dieser Arbeit werden Möglichkeiten aufgezeigt, mit Hilfe statistischer Verfahren zu verläßlichen Aussagen über die Existenz komplexer lexikalischer Einheiten zu kommen. Zu diesen Lexikoneinheiten zählen Funktionswörter ebenso wie Kollokationen und feste Wendungen. Grundlage der Untersuchungen sind Textkorpora des Deutschen. Bei der Bewertung der Güte verschiedener statistischer Verfahren zeigt es sich, daß die Wahl eines Verfahrens von der konkreten Aufgabe abhängig ist. Anhand dreier Fallstudien - Abtönungspartikeln, Verbpartikeln und Pronomen - wird anschaulich dargelegt, welcher Erkenntnisgewinn für die lexikalische Arbeit aus der Wahl des geeigneten statistischen Verfahrens zu ziehen ist. Für die maschinelle Sprachverarbeitung und das Computerlexikon von morgen folgt, daß korpusgestützte lexikalische Arbeit fruchtbringender ist als die systematische Auswertung gedruckter Wörterbücher. Es wird auch gezeigt, wie orthographisch komplexe Lexikoneinheiten angemessen in einem Computerlexikon repräsentiert werden können. Mit einem um komplexe Einheiten bereicherten Lexikon sind auch Probleme der Worterkennung beim Information Retrieval und in der Lexikostatistik besser zu meistern.</subfield></datafield><datafield tag="520" ind1=" " ind2=" "><subfield code="a">The availability of extensive text corpora opens up new vistas for computer language processing and lexicography. This study points up ways of using statistic procedures to arrive at reliable statements on complex lexical units on the basis of their recurrent incidence in text corpora. Various statistic approaches are discussed and their quality compared. Finally, three case studies (taken from German-language corpora) are presented to demonstrate the potentialities and limitations displayed by machine acquisition of complex lexical units.</subfield></datafield><datafield tag="530" ind1=" " ind2=" "><subfield code="a">Issued also in print.</subfield></datafield><datafield tag="538" ind1=" " ind2=" "><subfield code="a">Mode of access: Internet via World Wide Web.</subfield></datafield><datafield tag="546" ind1=" " ind2=" "><subfield code="a">In German.</subfield></datafield><datafield tag="588" ind1="0" ind2=" "><subfield code="a">Description based on online resource; title from PDF title page (publisher's Web site, viewed 28. Feb 2023)</subfield></datafield><datafield tag="650" ind1=" " ind2="7"><subfield code="a">LANGUAGE ARTS & DISCIPLINES / Linguistics / General.</subfield><subfield code="2">bisacsh</subfield></datafield><datafield tag="773" ind1="0" ind2="8"><subfield code="i">Title is part of eBook package:</subfield><subfield code="d">De Gruyter</subfield><subfield code="t">DGBA Linguistics and Semiotics 1990 - 1999</subfield><subfield code="z">9783110636895</subfield><subfield code="o">ZDB-23-DLS</subfield></datafield><datafield tag="776" ind1="0" ind2=" "><subfield code="c">print</subfield><subfield code="z">9783484311800</subfield></datafield><datafield tag="856" ind1="4" ind2="0"><subfield code="u">https://doi.org/10.1515/9783110927986</subfield></datafield><datafield tag="856" ind1="4" ind2="0"><subfield code="u">https://www.degruyter.com/isbn/9783110927986</subfield></datafield><datafield tag="856" ind1="4" ind2="2"><subfield code="3">Cover</subfield><subfield code="u">https://www.degruyter.com/document/cover/isbn/9783110927986/original</subfield></datafield><datafield tag="912" ind1=" " ind2=" "><subfield code="a">EBA_BACKALL</subfield></datafield><datafield tag="912" ind1=" " ind2=" "><subfield code="a">EBA_CL_LS</subfield></datafield><datafield tag="912" ind1=" " ind2=" "><subfield code="a">EBA_DGALL</subfield></datafield><datafield tag="912" ind1=" " ind2=" "><subfield code="a">EBA_EBKALL</subfield></datafield><datafield tag="912" ind1=" " ind2=" "><subfield code="a">EBA_SSHALL</subfield></datafield><datafield tag="912" ind1=" " ind2=" "><subfield code="a">GBV-deGruyter-alles</subfield></datafield><datafield tag="912" ind1=" " ind2=" "><subfield code="a">PDA11SSHE</subfield></datafield><datafield tag="912" ind1=" " ind2=" "><subfield code="a">PDA5EBK</subfield></datafield><datafield tag="912" ind1=" " ind2=" "><subfield code="a">ZDB-23-DLS</subfield><subfield code="c">1990</subfield><subfield code="d">1999</subfield></datafield></record></collection> |