Akquisition komplexer Lexeme aus Textkorpora / / Lothar Lemnitzer.

Aus der Verfügbarkeit großer Textkorpora ergeben sich für die maschinelle Sprachverarbeitung, für die Lexikographie und für das Information Retrieval neue Perspektiven. In dieser Arbeit werden Möglichkeiten aufgezeigt, mit Hilfe statistischer Verfahren zu verläßlichen Aussagen über die Existenz komp...

Full description

Saved in:
Bibliographic Details
Superior document:Title is part of eBook package: De Gruyter DGBA Linguistics and Semiotics 1990 - 1999
VerfasserIn:
Place / Publishing House:Tübingen : : Max Niemeyer Verlag, , [2011]
Max Niemeyer Verlag, , [1997]
©1997
Year of Publication:2011
1997
Edition:Reprint 2010
Language:German
Series:Reihe Germanistische Linguistik , 180
Online Access:
Physical Description:1 online resource (258 p.)
Tags: Add Tag
No Tags, Be the first to tag this record!
id 9783110927986
ctrlnum (DE-B1597)45823
(OCoLC)979637138
collection bib_alma
record_format marc
spelling Lemnitzer, Lothar, author. aut http://id.loc.gov/vocabulary/relators/aut
Akquisition komplexer Lexeme aus Textkorpora / Lothar Lemnitzer.
Reprint 2010
Tübingen : Max Niemeyer Verlag, [2011]
Max Niemeyer Verlag, [1997]
©1997
1 online resource (258 p.)
text txt rdacontent
computer c rdamedia
online resource cr rdacarrier
text file PDF rda
Reihe Germanistische Linguistik , 0344-6778 ; 180
I-X -- 1 Einleitung -- I Hintergrund -- 2 Lexikon, Text und Grammatik -- 3 Lexikalische und textuelle Zeichen -- II Korpusanalyse -- 4 Gegenstand und Methoden der Untersuchung -- 5 Fallstudien -- 6 Das Computerlexikon von morgen -- III Anhang -- 7 Literatur -- 8 Glossar -- 9 Häufigkeitslisten -- 10 MLexD-Formalismus -- 11 Document Type Definition für die FAZ-Zeitungsartikel
restricted access http://purl.org/coar/access_right/c_16ec online access with authorization star
Aus der Verfügbarkeit großer Textkorpora ergeben sich für die maschinelle Sprachverarbeitung, für die Lexikographie und für das Information Retrieval neue Perspektiven. In dieser Arbeit werden Möglichkeiten aufgezeigt, mit Hilfe statistischer Verfahren zu verläßlichen Aussagen über die Existenz komplexer lexikalischer Einheiten zu kommen. Zu diesen Lexikoneinheiten zählen Funktionswörter ebenso wie Kollokationen und feste Wendungen. Grundlage der Untersuchungen sind Textkorpora des Deutschen. Bei der Bewertung der Güte verschiedener statistischer Verfahren zeigt es sich, daß die Wahl eines Verfahrens von der konkreten Aufgabe abhängig ist. Anhand dreier Fallstudien - Abtönungspartikeln, Verbpartikeln und Pronomen - wird anschaulich dargelegt, welcher Erkenntnisgewinn für die lexikalische Arbeit aus der Wahl des geeigneten statistischen Verfahrens zu ziehen ist. Für die maschinelle Sprachverarbeitung und das Computerlexikon von morgen folgt, daß korpusgestützte lexikalische Arbeit fruchtbringender ist als die systematische Auswertung gedruckter Wörterbücher. Es wird auch gezeigt, wie orthographisch komplexe Lexikoneinheiten angemessen in einem Computerlexikon repräsentiert werden können. Mit einem um komplexe Einheiten bereicherten Lexikon sind auch Probleme der Worterkennung beim Information Retrieval und in der Lexikostatistik besser zu meistern.
The availability of extensive text corpora opens up new vistas for computer language processing and lexicography. This study points up ways of using statistic procedures to arrive at reliable statements on complex lexical units on the basis of their recurrent incidence in text corpora. Various statistic approaches are discussed and their quality compared. Finally, three case studies (taken from German-language corpora) are presented to demonstrate the potentialities and limitations displayed by machine acquisition of complex lexical units.
Issued also in print.
Mode of access: Internet via World Wide Web.
In German.
Description based on online resource; title from PDF title page (publisher's Web site, viewed 28. Feb 2023)
LANGUAGE ARTS & DISCIPLINES / Linguistics / General. bisacsh
Title is part of eBook package: De Gruyter DGBA Linguistics and Semiotics 1990 - 1999 9783110636895 ZDB-23-DLS
print 9783484311800
https://doi.org/10.1515/9783110927986
https://www.degruyter.com/isbn/9783110927986
Cover https://www.degruyter.com/document/cover/isbn/9783110927986/original
language German
format eBook
author Lemnitzer, Lothar,
Lemnitzer, Lothar,
spellingShingle Lemnitzer, Lothar,
Lemnitzer, Lothar,
Akquisition komplexer Lexeme aus Textkorpora /
Reihe Germanistische Linguistik ,
I-X --
1 Einleitung --
I Hintergrund --
2 Lexikon, Text und Grammatik --
3 Lexikalische und textuelle Zeichen --
II Korpusanalyse --
4 Gegenstand und Methoden der Untersuchung --
5 Fallstudien --
6 Das Computerlexikon von morgen --
III Anhang --
7 Literatur --
8 Glossar --
9 Häufigkeitslisten --
10 MLexD-Formalismus --
11 Document Type Definition für die FAZ-Zeitungsartikel
author_facet Lemnitzer, Lothar,
Lemnitzer, Lothar,
author_variant l l ll
l l ll
author_role VerfasserIn
VerfasserIn
author_sort Lemnitzer, Lothar,
title Akquisition komplexer Lexeme aus Textkorpora /
title_full Akquisition komplexer Lexeme aus Textkorpora / Lothar Lemnitzer.
title_fullStr Akquisition komplexer Lexeme aus Textkorpora / Lothar Lemnitzer.
title_full_unstemmed Akquisition komplexer Lexeme aus Textkorpora / Lothar Lemnitzer.
title_auth Akquisition komplexer Lexeme aus Textkorpora /
title_alt I-X --
1 Einleitung --
I Hintergrund --
2 Lexikon, Text und Grammatik --
3 Lexikalische und textuelle Zeichen --
II Korpusanalyse --
4 Gegenstand und Methoden der Untersuchung --
5 Fallstudien --
6 Das Computerlexikon von morgen --
III Anhang --
7 Literatur --
8 Glossar --
9 Häufigkeitslisten --
10 MLexD-Formalismus --
11 Document Type Definition für die FAZ-Zeitungsartikel
title_new Akquisition komplexer Lexeme aus Textkorpora /
title_sort akquisition komplexer lexeme aus textkorpora /
series Reihe Germanistische Linguistik ,
series2 Reihe Germanistische Linguistik ,
publisher Max Niemeyer Verlag,
publishDate 2011
1997
physical 1 online resource (258 p.)
Issued also in print.
edition Reprint 2010
contents I-X --
1 Einleitung --
I Hintergrund --
2 Lexikon, Text und Grammatik --
3 Lexikalische und textuelle Zeichen --
II Korpusanalyse --
4 Gegenstand und Methoden der Untersuchung --
5 Fallstudien --
6 Das Computerlexikon von morgen --
III Anhang --
7 Literatur --
8 Glossar --
9 Häufigkeitslisten --
10 MLexD-Formalismus --
11 Document Type Definition für die FAZ-Zeitungsartikel
isbn 9783110927986
9783110636895
9783484311800
issn 0344-6778 ;
callnumber-first P - Language and Literature
callnumber-subject PF - West Germanic Languages
callnumber-label PF3611
callnumber-sort PF 43611 L45 41997
url https://doi.org/10.1515/9783110927986
https://www.degruyter.com/isbn/9783110927986
https://www.degruyter.com/document/cover/isbn/9783110927986/original
illustrated Not Illustrated
dewey-hundreds 400 - Language
dewey-tens 430 - German & related languages
dewey-ones 433 - German dictionaries
dewey-full 433.028
dewey-sort 3433.028
dewey-raw 433.028
dewey-search 433.028
doi_str_mv 10.1515/9783110927986
oclc_num 979637138
work_keys_str_mv AT lemnitzerlothar akquisitionkomplexerlexemeaustextkorpora
status_str n
ids_txt_mv (DE-B1597)45823
(OCoLC)979637138
carrierType_str_mv cr
hierarchy_parent_title Title is part of eBook package: De Gruyter DGBA Linguistics and Semiotics 1990 - 1999
is_hierarchy_title Akquisition komplexer Lexeme aus Textkorpora /
container_title Title is part of eBook package: De Gruyter DGBA Linguistics and Semiotics 1990 - 1999
_version_ 1806144840960835584
fullrecord <?xml version="1.0" encoding="UTF-8"?><collection xmlns="http://www.loc.gov/MARC21/slim"><record><leader>04690nam a22006615i 4500</leader><controlfield tag="001">9783110927986</controlfield><controlfield tag="003">DE-B1597</controlfield><controlfield tag="005">20230228015514.0</controlfield><controlfield tag="006">m|||||o||d||||||||</controlfield><controlfield tag="007">cr || ||||||||</controlfield><controlfield tag="008">230228t20111997gw fo d z ger d</controlfield><datafield tag="019" ind1=" " ind2=" "><subfield code="a">(OCoLC)1049636806</subfield></datafield><datafield tag="020" ind1=" " ind2=" "><subfield code="a">9783110927986</subfield></datafield><datafield tag="024" ind1="7" ind2=" "><subfield code="a">10.1515/9783110927986</subfield><subfield code="2">doi</subfield></datafield><datafield tag="035" ind1=" " ind2=" "><subfield code="a">(DE-B1597)45823</subfield></datafield><datafield tag="035" ind1=" " ind2=" "><subfield code="a">(OCoLC)979637138</subfield></datafield><datafield tag="040" ind1=" " ind2=" "><subfield code="a">DE-B1597</subfield><subfield code="b">eng</subfield><subfield code="c">DE-B1597</subfield><subfield code="e">rda</subfield></datafield><datafield tag="041" ind1="0" ind2=" "><subfield code="a">ger</subfield></datafield><datafield tag="044" ind1=" " ind2=" "><subfield code="a">gw</subfield><subfield code="c">DE</subfield></datafield><datafield tag="050" ind1=" " ind2="4"><subfield code="a">PF3611 .L45 1997</subfield></datafield><datafield tag="072" ind1=" " ind2="7"><subfield code="a">LAN009000</subfield><subfield code="2">bisacsh</subfield></datafield><datafield tag="082" ind1="0" ind2="4"><subfield code="a">433.028</subfield></datafield><datafield tag="084" ind1=" " ind2=" "><subfield code="a">ES 965</subfield><subfield code="2">rvk</subfield><subfield code="0">(DE-625)rvk/27939:</subfield></datafield><datafield tag="100" ind1="1" ind2=" "><subfield code="a">Lemnitzer, Lothar, </subfield><subfield code="e">author.</subfield><subfield code="4">aut</subfield><subfield code="4">http://id.loc.gov/vocabulary/relators/aut</subfield></datafield><datafield tag="245" ind1="1" ind2="0"><subfield code="a">Akquisition komplexer Lexeme aus Textkorpora /</subfield><subfield code="c">Lothar Lemnitzer.</subfield></datafield><datafield tag="250" ind1=" " ind2=" "><subfield code="a">Reprint 2010</subfield></datafield><datafield tag="264" ind1="3" ind2="1"><subfield code="a">Tübingen : </subfield><subfield code="b">Max Niemeyer Verlag, </subfield><subfield code="c">[2011]</subfield></datafield><datafield tag="264" ind1=" " ind2="1"><subfield code="b">Max Niemeyer Verlag, </subfield><subfield code="c">[1997]</subfield></datafield><datafield tag="264" ind1=" " ind2="4"><subfield code="c">©1997</subfield></datafield><datafield tag="300" ind1=" " ind2=" "><subfield code="a">1 online resource (258 p.)</subfield></datafield><datafield tag="336" ind1=" " ind2=" "><subfield code="a">text</subfield><subfield code="b">txt</subfield><subfield code="2">rdacontent</subfield></datafield><datafield tag="337" ind1=" " ind2=" "><subfield code="a">computer</subfield><subfield code="b">c</subfield><subfield code="2">rdamedia</subfield></datafield><datafield tag="338" ind1=" " ind2=" "><subfield code="a">online resource</subfield><subfield code="b">cr</subfield><subfield code="2">rdacarrier</subfield></datafield><datafield tag="347" ind1=" " ind2=" "><subfield code="a">text file</subfield><subfield code="b">PDF</subfield><subfield code="2">rda</subfield></datafield><datafield tag="490" ind1="0" ind2=" "><subfield code="a">Reihe Germanistische Linguistik ,</subfield><subfield code="x">0344-6778 ;</subfield><subfield code="v">180</subfield></datafield><datafield tag="505" ind1="0" ind2="0"><subfield code="t">I-X -- </subfield><subfield code="t">1 Einleitung -- </subfield><subfield code="t">I Hintergrund -- </subfield><subfield code="t">2 Lexikon, Text und Grammatik -- </subfield><subfield code="t">3 Lexikalische und textuelle Zeichen -- </subfield><subfield code="t">II Korpusanalyse -- </subfield><subfield code="t">4 Gegenstand und Methoden der Untersuchung -- </subfield><subfield code="t">5 Fallstudien -- </subfield><subfield code="t">6 Das Computerlexikon von morgen -- </subfield><subfield code="t">III Anhang -- </subfield><subfield code="t">7 Literatur -- </subfield><subfield code="t">8 Glossar -- </subfield><subfield code="t">9 Häufigkeitslisten -- </subfield><subfield code="t">10 MLexD-Formalismus -- </subfield><subfield code="t">11 Document Type Definition für die FAZ-Zeitungsartikel</subfield></datafield><datafield tag="506" ind1="0" ind2=" "><subfield code="a">restricted access</subfield><subfield code="u">http://purl.org/coar/access_right/c_16ec</subfield><subfield code="f">online access with authorization</subfield><subfield code="2">star</subfield></datafield><datafield tag="520" ind1=" " ind2=" "><subfield code="a">Aus der Verfügbarkeit großer Textkorpora ergeben sich für die maschinelle Sprachverarbeitung, für die Lexikographie und für das Information Retrieval neue Perspektiven. In dieser Arbeit werden Möglichkeiten aufgezeigt, mit Hilfe statistischer Verfahren zu verläßlichen Aussagen über die Existenz komplexer lexikalischer Einheiten zu kommen. Zu diesen Lexikoneinheiten zählen Funktionswörter ebenso wie Kollokationen und feste Wendungen. Grundlage der Untersuchungen sind Textkorpora des Deutschen. Bei der Bewertung der Güte verschiedener statistischer Verfahren zeigt es sich, daß die Wahl eines Verfahrens von der konkreten Aufgabe abhängig ist. Anhand dreier Fallstudien - Abtönungspartikeln, Verbpartikeln und Pronomen - wird anschaulich dargelegt, welcher Erkenntnisgewinn für die lexikalische Arbeit aus der Wahl des geeigneten statistischen Verfahrens zu ziehen ist. Für die maschinelle Sprachverarbeitung und das Computerlexikon von morgen folgt, daß korpusgestützte lexikalische Arbeit fruchtbringender ist als die systematische Auswertung gedruckter Wörterbücher. Es wird auch gezeigt, wie orthographisch komplexe Lexikoneinheiten angemessen in einem Computerlexikon repräsentiert werden können. Mit einem um komplexe Einheiten bereicherten Lexikon sind auch Probleme der Worterkennung beim Information Retrieval und in der Lexikostatistik besser zu meistern.</subfield></datafield><datafield tag="520" ind1=" " ind2=" "><subfield code="a">The availability of extensive text corpora opens up new vistas for computer language processing and lexicography. This study points up ways of using statistic procedures to arrive at reliable statements on complex lexical units on the basis of their recurrent incidence in text corpora. Various statistic approaches are discussed and their quality compared. Finally, three case studies (taken from German-language corpora) are presented to demonstrate the potentialities and limitations displayed by machine acquisition of complex lexical units.</subfield></datafield><datafield tag="530" ind1=" " ind2=" "><subfield code="a">Issued also in print.</subfield></datafield><datafield tag="538" ind1=" " ind2=" "><subfield code="a">Mode of access: Internet via World Wide Web.</subfield></datafield><datafield tag="546" ind1=" " ind2=" "><subfield code="a">In German.</subfield></datafield><datafield tag="588" ind1="0" ind2=" "><subfield code="a">Description based on online resource; title from PDF title page (publisher's Web site, viewed 28. Feb 2023)</subfield></datafield><datafield tag="650" ind1=" " ind2="7"><subfield code="a">LANGUAGE ARTS &amp; DISCIPLINES / Linguistics / General.</subfield><subfield code="2">bisacsh</subfield></datafield><datafield tag="773" ind1="0" ind2="8"><subfield code="i">Title is part of eBook package:</subfield><subfield code="d">De Gruyter</subfield><subfield code="t">DGBA Linguistics and Semiotics 1990 - 1999</subfield><subfield code="z">9783110636895</subfield><subfield code="o">ZDB-23-DLS</subfield></datafield><datafield tag="776" ind1="0" ind2=" "><subfield code="c">print</subfield><subfield code="z">9783484311800</subfield></datafield><datafield tag="856" ind1="4" ind2="0"><subfield code="u">https://doi.org/10.1515/9783110927986</subfield></datafield><datafield tag="856" ind1="4" ind2="0"><subfield code="u">https://www.degruyter.com/isbn/9783110927986</subfield></datafield><datafield tag="856" ind1="4" ind2="2"><subfield code="3">Cover</subfield><subfield code="u">https://www.degruyter.com/document/cover/isbn/9783110927986/original</subfield></datafield><datafield tag="912" ind1=" " ind2=" "><subfield code="a">EBA_BACKALL</subfield></datafield><datafield tag="912" ind1=" " ind2=" "><subfield code="a">EBA_CL_LS</subfield></datafield><datafield tag="912" ind1=" " ind2=" "><subfield code="a">EBA_DGALL</subfield></datafield><datafield tag="912" ind1=" " ind2=" "><subfield code="a">EBA_EBKALL</subfield></datafield><datafield tag="912" ind1=" " ind2=" "><subfield code="a">EBA_SSHALL</subfield></datafield><datafield tag="912" ind1=" " ind2=" "><subfield code="a">GBV-deGruyter-alles</subfield></datafield><datafield tag="912" ind1=" " ind2=" "><subfield code="a">PDA11SSHE</subfield></datafield><datafield tag="912" ind1=" " ind2=" "><subfield code="a">PDA5EBK</subfield></datafield><datafield tag="912" ind1=" " ind2=" "><subfield code="a">ZDB-23-DLS</subfield><subfield code="c">1990</subfield><subfield code="d">1999</subfield></datafield></record></collection>