Testo e computer: elementi di linguistica computazionale
Gespeichert in:
Hauptverfasser: | , , |
---|---|
Format: | Buch |
Sprache: | Italian |
Veröffentlicht: |
Roma
Carocci editore
[settembre 2016]
|
Ausgabe: | 1a edizione Aulamagna |
Schriftenreihe: | Aulamagna
12 |
Schlagworte: | |
Online-Zugang: | Inhaltsverzeichnis Klappentext |
Beschreibung: | Bibliogr.: p. 249-250 |
Beschreibung: | 255 Seiten Diagramme |
ISBN: | 9788843083060 8843083066 |
Internformat
MARC
LEADER | 00000nam a2200000 cb4500 | ||
---|---|---|---|
001 | BV044996295 | ||
003 | DE-604 | ||
005 | 20180712 | ||
007 | t | ||
008 | 180606s2016 |||| |||| 00||| ita d | ||
020 | |a 9788843083060 |9 978-88-430-8306-0 | ||
020 | |a 8843083066 |9 88-430-8306-6 | ||
035 | |a (OCoLC)960477587 | ||
035 | |a (DE-599)BSZ486228916 | ||
040 | |a DE-604 |b ger |e rda | ||
041 | 0 | |a ita | |
049 | |a DE-355 | ||
084 | |a ES 900 |0 (DE-625)27926: |2 rvk | ||
100 | 1 | |a Lenci, Alessandro |e Verfasser |4 aut | |
245 | 1 | 0 | |a Testo e computer |b elementi di linguistica computazionale |c Alessandro Lenci, Simonetta Montemagni, Vito Pirrelli |
250 | |a 1a edizione Aulamagna | ||
264 | 1 | |a Roma |b Carocci editore |c [settembre 2016] | |
300 | |a 255 Seiten |b Diagramme | ||
336 | |b txt |2 rdacontent | ||
337 | |b n |2 rdamedia | ||
338 | |b nc |2 rdacarrier | ||
490 | 1 | |a Aulamagna |v 12 | |
500 | |a Bibliogr.: p. 249-250 | ||
650 | 0 | 7 | |a Computerlinguistik |0 (DE-588)4035843-4 |2 gnd |9 rswk-swf |
650 | 0 | 7 | |a Korpus |g Linguistik |0 (DE-588)4165338-5 |2 gnd |9 rswk-swf |
689 | 0 | 0 | |a Korpus |g Linguistik |0 (DE-588)4165338-5 |D s |
689 | 0 | 1 | |a Computerlinguistik |0 (DE-588)4035843-4 |D s |
689 | 0 | |5 DE-604 | |
700 | 1 | |a Montemagni, Simonetta |e Verfasser |4 aut | |
700 | 1 | |a Pirrelli, Vito |e Verfasser |4 aut | |
830 | 0 | |a Aulamagna |v 12 |w (DE-604)BV043837198 |9 12 | |
856 | 4 | 2 | |m Digitalisierung UB Regensburg - ADAM Catalogue Enrichment |q application/pdf |u http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=030388526&sequence=000003&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA |3 Inhaltsverzeichnis |
856 | 4 | 2 | |m Digitalisierung UB Regensburg - ADAM Catalogue Enrichment |q application/pdf |u http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=030388526&sequence=000004&line_number=0002&func_code=DB_RECORDS&service_type=MEDIA |3 Klappentext |
943 | 1 | |a oai:aleph.bib-bvb.de:BVB01-030388526 |
Datensatz im Suchindex
_version_ | 1807956192896483328 |
---|---|
adam_text |
Indice
Introduzione 11
Linguaggio e computer n
La lingüistica computazionale tra ieri e oggi 14
Di cosa parla questo libro 18
Parte prima
II dato testuale e la sua rappresentazione
1. I dati della lingua 23
1.1. Le fonti dei dati linguistici 23
1.1.1. Dati “ecologici” e dati controllati
x.2. I corpora 26
1.2.1. Tipi di corpora
1.3. II corpus come campione 34
1.3.1. Rappresentativitá e variabllita / 1.3.2. Corpora bilanciati
1.4. I corpora in lc: istruzioni per Tuso 38
1.4.1. I limiti della rappresentativitá / 1.4.2. II corpus come bench-
mark / 1.4.3. I corpora specialistici / 1.4.4. Corpora di addestramento /
1.4.3. Usare il web come corpus
1.3. Considerazioni conclusive 30
Per saperne di piü 31
2. H testo e la sua codifica digitale 33
2.x. La codifica digitale del testo; il problema 33
2.2. Livellí di codifica 36
7
TESTO E COMPUTER
2.3. La codifica di livello zero 57
2.3.1. II set di caratteri ASCII / 2.3.2. II set di caratteri Unicode
2.4. La codifica di alto livello: perché, cosa, come 62
2.4.1. Perché codificare / 2.4.2. Cosa codificare / 2.4.3. Come codifi-
care
2.5. Considerazioni conclusive 69
Per saperne di piü 69
3. Costruire un línguaggio di marcatura 71
3.1. xml: principi di base 71
3.2. I componenti della marcatura xml 73
3.2.1. Elementi / 3.2.2. Attributi / 3.2.3. Riferimenti a carattere e a
entitá / 3.2.4. Commenti
3.3. La defínizione del tipo di documento (dtd) 79
3.3.1. La dichiarazíone di un elemento / 3.3.2. La dichiarazione di un
attributo / 3.3.3. La dichiarazione di un’entitá
3.4. Struttura e vaíidazione di un documento xml 86
3.5. La codifica del testo in formato xml: un esempio 88
3.6. Standard e codifica del testo 91
3.6.1. Iniziative internazionali di standardízzazione della codifica del
testo / 3.6.2. Lo schema di codifica xces
3.7. Considerazioni conclusive 97
Per saperne di piü 98
Parte seconda
Metodi e tecniche di analisi testuale
4. Dal bit alia parola 101
4.1. La “tokenízzazione” del testo 102
4.1.1. I criteri per la tokenízzazíone
4.2. Le espressioni regolari m
4.2.1. La sintassí delle espressioni regolari
4.3. Analizzare il línguaggio con le espressioni regolari 120
Per saperne di piü 122
8
INDICE
5. Parole e numeri 123
5.1. Popolazione e testo 123
5.2. Parole unitá e parole tipo 124
5.3. Frequenze e distribuzioni 127
5.3.1. La media aritmética / 5,3.2. La deviazione standard /
5.3.3. Leggere le distribuzioni
3.4. II vocabolario di un testo 132
5.4.1. Rapporto tipo/unitá / 5.4.2. Parole grammaticali e parole piene
5.3. La legge di Zipf 137
5.5.1. La famiglia Zipf
3.6. La dinámica del vocabolario 143
5.6.1. La crescíta di V / 5.6.2. La frequenza medía
3.7. Medie e inferenza statistica 148
Per saperne di piü 132
6. Probabilitá ed entropía 133
6.1. II concetto di probabilitá 133
6.1. x. Spazio campionario e distríbuzione di probabilitá / 6.1.2. Even-
ti congiunti / 6.1.3. Probabilitá e frequenza
6.2. Lingua e probabilitá 139
6.2.1. Modelli stocastici / 6.2.2. Modelli linguistici stocastici
6.3. Modelli markoviani 163
6.3.1. II modello base: Turna lessicale / 6.3.2. Probabilitá condiziona-
te e catene markovíane del primo ordine / 6.3.3. Oltre le catene del
primo ordine
6.4. Linguaggio ed entropía 171
6.4.1. Vocabolario ed entropía / 6.4.2. Testo ed entropía
6.3. Considerazioni conclusive 179
Per saperne di piü 182
Parte terza
Esplorazione e annotazione del testo
7. Esplorare il testo 183
7.1. Modi di esplorazione 187
7.2. Le parole e il loro habitat: le concordanze 188
7.2.1. Tipi di concordanze
9
TESTO E COMPUTER
7.3. Funzioni di ricerca avanzate 192
7.3.1. Problemi e soluzioní
7.4. Collocazioni 196
7.4.1. Alia ricerca di collocazioni
7.3. Conclusioni 207
Per saperne di piú 208
8. L’annotazione lingüistica del testo 211
8.1. Livelli di annotazione 213
8.1. x. Annotazione morfo-sintattica / 8.1.2. Annotazione sintattica /
8.1.3, Annotazione semántica / 8.1.4. Annotazione pragmática
8.2. Corpora annotati
8.3. “Anatomía” di uno schéma di annotazione
8.3.1. Annotazione e informazíone categoriale / 8.3.2. Annotazione e
informazione structurale / 8.3.3. Annotazione e informazíone relazio-
nale / 8.3.4. Tipi di informazíone di base e schemi di annotazione
8.4. Tipi di informazione e rappresentazione xml 227
8.4.1. Rappresentazione xml di informazíone categoriale / 8.4.2. Rap¬
presentazione xml di informazione strutturale / 8.4.3. Rappresentazio¬
ne xml di informazione relazionale
8.5. Annotazione stand-off 233
8.6. Standard e annotazione lingüistica 233
8.7. Per concludere 237
Per saperne di piú 238
9- Verso il trattamento automático della lingua 241
9.1. Insegnare la lingua al computer 241
9.2. Un esempio: la morfología 243
9.3. Alcune conclusioni (in forma di introduzione) 246
Bibliografía 249
Indice analítico 231
217
219
10
In che modo il computer puô aiutarci a comprendere come funziona la nostra
lingua? Che cosa significa analizzare un testo con l’aiuto di un calcolatore ? In
che misura possiamo estendere le potenzialità del computer rendendolo capa-
ce di interagire con gli utenti umani nella loro lingua? Queste e altre doman-
de sono l’oggetto di indagine délia lingüistica computazionale, una disciplina
che ha al suo centro proprio il rapporto tra lingua e computer. Il libro fornisce
gli elementi di base délia lingüistica computazionale partendo da un interesse
primario per il testo, la sua struttura e il suo contenuto. Il volume propone una
sintesi equilibrata e accessibile tra sapere e fare, nozioni di base e loro appli-
cazione, ed è destinato in primo luogo agli studenti delle facoltà umanistiche
e scientifiche interessati aU’interazione tra scienze umane e informática, ma
anche agli studiosi che vogliano imparare a usare il computer corne strumento
di ricerca sul linguaggio.
Alessandro Lenci è professore associato di Glottologia e lingüistica all’Uni-
versità di Pisa e insegna Lingüistica computazionale presso il corso di laurea
in Informática umanistica del medesimo ateneo.
Simonetta Montemagni è dirigente di ricerca presso l’Istituto di Lingüistica
computazionale del CNR di Pisa e Lingüistica computazionale presso il corso
di laurea magistrale in Informática umanistica delTUniversità di Pisa.
Vito Pirrelli é dirigente di ricerca presso l’Istituto di Lingüistica computazio-
nale del cnr di Pisa. |
any_adam_object | 1 |
author | Lenci, Alessandro Montemagni, Simonetta Pirrelli, Vito |
author_facet | Lenci, Alessandro Montemagni, Simonetta Pirrelli, Vito |
author_role | aut aut aut |
author_sort | Lenci, Alessandro |
author_variant | a l al s m sm v p vp |
building | Verbundindex |
bvnumber | BV044996295 |
classification_rvk | ES 900 |
ctrlnum | (OCoLC)960477587 (DE-599)BSZ486228916 |
discipline | Sprachwissenschaft Literaturwissenschaft |
edition | 1a edizione Aulamagna |
format | Book |
fullrecord | <?xml version="1.0" encoding="UTF-8"?><collection xmlns="http://www.loc.gov/MARC21/slim"><record><leader>00000nam a2200000 cb4500</leader><controlfield tag="001">BV044996295</controlfield><controlfield tag="003">DE-604</controlfield><controlfield tag="005">20180712</controlfield><controlfield tag="007">t</controlfield><controlfield tag="008">180606s2016 |||| |||| 00||| ita d</controlfield><datafield tag="020" ind1=" " ind2=" "><subfield code="a">9788843083060</subfield><subfield code="9">978-88-430-8306-0</subfield></datafield><datafield tag="020" ind1=" " ind2=" "><subfield code="a">8843083066</subfield><subfield code="9">88-430-8306-6</subfield></datafield><datafield tag="035" ind1=" " ind2=" "><subfield code="a">(OCoLC)960477587</subfield></datafield><datafield tag="035" ind1=" " ind2=" "><subfield code="a">(DE-599)BSZ486228916</subfield></datafield><datafield tag="040" ind1=" " ind2=" "><subfield code="a">DE-604</subfield><subfield code="b">ger</subfield><subfield code="e">rda</subfield></datafield><datafield tag="041" ind1="0" ind2=" "><subfield code="a">ita</subfield></datafield><datafield tag="049" ind1=" " ind2=" "><subfield code="a">DE-355</subfield></datafield><datafield tag="084" ind1=" " ind2=" "><subfield code="a">ES 900</subfield><subfield code="0">(DE-625)27926:</subfield><subfield code="2">rvk</subfield></datafield><datafield tag="100" ind1="1" ind2=" "><subfield code="a">Lenci, Alessandro</subfield><subfield code="e">Verfasser</subfield><subfield code="4">aut</subfield></datafield><datafield tag="245" ind1="1" ind2="0"><subfield code="a">Testo e computer</subfield><subfield code="b">elementi di linguistica computazionale</subfield><subfield code="c">Alessandro Lenci, Simonetta Montemagni, Vito Pirrelli</subfield></datafield><datafield tag="250" ind1=" " ind2=" "><subfield code="a">1a edizione Aulamagna</subfield></datafield><datafield tag="264" ind1=" " ind2="1"><subfield code="a">Roma</subfield><subfield code="b">Carocci editore</subfield><subfield code="c">[settembre 2016]</subfield></datafield><datafield tag="300" ind1=" " ind2=" "><subfield code="a">255 Seiten</subfield><subfield code="b">Diagramme</subfield></datafield><datafield tag="336" ind1=" " ind2=" "><subfield code="b">txt</subfield><subfield code="2">rdacontent</subfield></datafield><datafield tag="337" ind1=" " ind2=" "><subfield code="b">n</subfield><subfield code="2">rdamedia</subfield></datafield><datafield tag="338" ind1=" " ind2=" "><subfield code="b">nc</subfield><subfield code="2">rdacarrier</subfield></datafield><datafield tag="490" ind1="1" ind2=" "><subfield code="a">Aulamagna</subfield><subfield code="v">12</subfield></datafield><datafield tag="500" ind1=" " ind2=" "><subfield code="a">Bibliogr.: p. 249-250</subfield></datafield><datafield tag="650" ind1="0" ind2="7"><subfield code="a">Computerlinguistik</subfield><subfield code="0">(DE-588)4035843-4</subfield><subfield code="2">gnd</subfield><subfield code="9">rswk-swf</subfield></datafield><datafield tag="650" ind1="0" ind2="7"><subfield code="a">Korpus</subfield><subfield code="g">Linguistik</subfield><subfield code="0">(DE-588)4165338-5</subfield><subfield code="2">gnd</subfield><subfield code="9">rswk-swf</subfield></datafield><datafield tag="689" ind1="0" ind2="0"><subfield code="a">Korpus</subfield><subfield code="g">Linguistik</subfield><subfield code="0">(DE-588)4165338-5</subfield><subfield code="D">s</subfield></datafield><datafield tag="689" ind1="0" ind2="1"><subfield code="a">Computerlinguistik</subfield><subfield code="0">(DE-588)4035843-4</subfield><subfield code="D">s</subfield></datafield><datafield tag="689" ind1="0" ind2=" "><subfield code="5">DE-604</subfield></datafield><datafield tag="700" ind1="1" ind2=" "><subfield code="a">Montemagni, Simonetta</subfield><subfield code="e">Verfasser</subfield><subfield code="4">aut</subfield></datafield><datafield tag="700" ind1="1" ind2=" "><subfield code="a">Pirrelli, Vito</subfield><subfield code="e">Verfasser</subfield><subfield code="4">aut</subfield></datafield><datafield tag="830" ind1=" " ind2="0"><subfield code="a">Aulamagna</subfield><subfield code="v">12</subfield><subfield code="w">(DE-604)BV043837198</subfield><subfield code="9">12</subfield></datafield><datafield tag="856" ind1="4" ind2="2"><subfield code="m">Digitalisierung UB Regensburg - ADAM Catalogue Enrichment</subfield><subfield code="q">application/pdf</subfield><subfield code="u">http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=030388526&sequence=000003&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA</subfield><subfield code="3">Inhaltsverzeichnis</subfield></datafield><datafield tag="856" ind1="4" ind2="2"><subfield code="m">Digitalisierung UB Regensburg - ADAM Catalogue Enrichment</subfield><subfield code="q">application/pdf</subfield><subfield code="u">http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=030388526&sequence=000004&line_number=0002&func_code=DB_RECORDS&service_type=MEDIA</subfield><subfield code="3">Klappentext</subfield></datafield><datafield tag="943" ind1="1" ind2=" "><subfield code="a">oai:aleph.bib-bvb.de:BVB01-030388526</subfield></datafield></record></collection> |
id | DE-604.BV044996295 |
illustrated | Not Illustrated |
indexdate | 2024-08-21T00:49:45Z |
institution | BVB |
isbn | 9788843083060 8843083066 |
language | Italian |
oai_aleph_id | oai:aleph.bib-bvb.de:BVB01-030388526 |
oclc_num | 960477587 |
open_access_boolean | |
owner | DE-355 DE-BY-UBR |
owner_facet | DE-355 DE-BY-UBR |
physical | 255 Seiten Diagramme |
publishDate | 2016 |
publishDateSearch | 2016 |
publishDateSort | 2016 |
publisher | Carocci editore |
record_format | marc |
series | Aulamagna |
series2 | Aulamagna |
spelling | Lenci, Alessandro Verfasser aut Testo e computer elementi di linguistica computazionale Alessandro Lenci, Simonetta Montemagni, Vito Pirrelli 1a edizione Aulamagna Roma Carocci editore [settembre 2016] 255 Seiten Diagramme txt rdacontent n rdamedia nc rdacarrier Aulamagna 12 Bibliogr.: p. 249-250 Computerlinguistik (DE-588)4035843-4 gnd rswk-swf Korpus Linguistik (DE-588)4165338-5 gnd rswk-swf Korpus Linguistik (DE-588)4165338-5 s Computerlinguistik (DE-588)4035843-4 s DE-604 Montemagni, Simonetta Verfasser aut Pirrelli, Vito Verfasser aut Aulamagna 12 (DE-604)BV043837198 12 Digitalisierung UB Regensburg - ADAM Catalogue Enrichment application/pdf http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=030388526&sequence=000003&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA Inhaltsverzeichnis Digitalisierung UB Regensburg - ADAM Catalogue Enrichment application/pdf http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=030388526&sequence=000004&line_number=0002&func_code=DB_RECORDS&service_type=MEDIA Klappentext |
spellingShingle | Lenci, Alessandro Montemagni, Simonetta Pirrelli, Vito Testo e computer elementi di linguistica computazionale Aulamagna Computerlinguistik (DE-588)4035843-4 gnd Korpus Linguistik (DE-588)4165338-5 gnd |
subject_GND | (DE-588)4035843-4 (DE-588)4165338-5 |
title | Testo e computer elementi di linguistica computazionale |
title_auth | Testo e computer elementi di linguistica computazionale |
title_exact_search | Testo e computer elementi di linguistica computazionale |
title_full | Testo e computer elementi di linguistica computazionale Alessandro Lenci, Simonetta Montemagni, Vito Pirrelli |
title_fullStr | Testo e computer elementi di linguistica computazionale Alessandro Lenci, Simonetta Montemagni, Vito Pirrelli |
title_full_unstemmed | Testo e computer elementi di linguistica computazionale Alessandro Lenci, Simonetta Montemagni, Vito Pirrelli |
title_short | Testo e computer |
title_sort | testo e computer elementi di linguistica computazionale |
title_sub | elementi di linguistica computazionale |
topic | Computerlinguistik (DE-588)4035843-4 gnd Korpus Linguistik (DE-588)4165338-5 gnd |
topic_facet | Computerlinguistik Korpus Linguistik |
url | http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=030388526&sequence=000003&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=030388526&sequence=000004&line_number=0002&func_code=DB_RECORDS&service_type=MEDIA |
volume_link | (DE-604)BV043837198 |
work_keys_str_mv | AT lencialessandro testoecomputerelementidilinguisticacomputazionale AT montemagnisimonetta testoecomputerelementidilinguisticacomputazionale AT pirrellivito testoecomputerelementidilinguisticacomputazionale |