Handbuch zur Anonymisierung wirtschaftsstatistischer Mikrodaten:
Gespeichert in:
Format: | Buch |
---|---|
Sprache: | German |
Veröffentlicht: |
Wiesbaden
Statistisches Bundesamt
2005
|
Schriftenreihe: | Statistik und Wissenschaft
4 |
Schlagworte: | |
Online-Zugang: | Inhaltsverzeichnis |
Beschreibung: | Literaturverz.: S. 600- 608 |
Beschreibung: | 612 S. graph. Darst. |
ISBN: | 3824607565 |
Internformat
MARC
LEADER | 00000nam a2200000 cb4500 | ||
---|---|---|---|
001 | BV020827001 | ||
003 | DE-604 | ||
005 | 20101222 | ||
007 | t | ||
008 | 051011s2005 gw d||| |||| 00||| ger d | ||
020 | |a 3824607565 |9 3-8246-0756-5 | ||
035 | |a (OCoLC)163431049 | ||
035 | |a (DE-599)BVBBV020827001 | ||
040 | |a DE-604 |b ger |e rakwb | ||
041 | 0 | |a ger | |
044 | |a gw |c DE | ||
049 | |a DE-M158 |a DE-19 |a DE-12 |a DE-1102 |a DE-11 | ||
082 | 0 | |a 310 | |
084 | |a QH 200 |0 (DE-625)141539: |2 rvk | ||
245 | 1 | 0 | |a Handbuch zur Anonymisierung wirtschaftsstatistischer Mikrodaten |c Gerd Ronning ... |
264 | 1 | |a Wiesbaden |b Statistisches Bundesamt |c 2005 | |
300 | |a 612 S. |b graph. Darst. | ||
336 | |b txt |2 rdacontent | ||
337 | |b n |2 rdamedia | ||
338 | |b nc |2 rdacarrier | ||
490 | 1 | |a Statistik und Wissenschaft |v 4 | |
500 | |a Literaturverz.: S. 600- 608 | ||
650 | 0 | 7 | |a Anonymisierung |0 (DE-588)4139362-4 |2 gnd |9 rswk-swf |
650 | 0 | 7 | |a Auswirkung |0 (DE-588)4112646-4 |2 gnd |9 rswk-swf |
650 | 0 | 7 | |a Datenveränderung |0 (DE-588)4232201-7 |2 gnd |9 rswk-swf |
650 | 0 | 7 | |a Wirtschaftsstatistik |0 (DE-588)4066517-3 |2 gnd |9 rswk-swf |
650 | 0 | 7 | |a Personenbezogene Daten |0 (DE-588)4173908-5 |2 gnd |9 rswk-swf |
650 | 0 | 7 | |a Datenschutz |0 (DE-588)4011134-9 |2 gnd |9 rswk-swf |
651 | 7 | |a Deutschland |0 (DE-588)4011882-4 |2 gnd |9 rswk-swf | |
689 | 0 | 0 | |a Deutschland |0 (DE-588)4011882-4 |D g |
689 | 0 | 1 | |a Wirtschaftsstatistik |0 (DE-588)4066517-3 |D s |
689 | 0 | 2 | |a Personenbezogene Daten |0 (DE-588)4173908-5 |D s |
689 | 0 | 3 | |a Datenschutz |0 (DE-588)4011134-9 |D s |
689 | 0 | |5 DE-604 | |
689 | 1 | 0 | |a Deutschland |0 (DE-588)4011882-4 |D g |
689 | 1 | 1 | |a Wirtschaftsstatistik |0 (DE-588)4066517-3 |D s |
689 | 1 | 2 | |a Personenbezogene Daten |0 (DE-588)4173908-5 |D s |
689 | 1 | 3 | |a Anonymisierung |0 (DE-588)4139362-4 |D s |
689 | 1 | 4 | |a Datenveränderung |0 (DE-588)4232201-7 |D s |
689 | 1 | 5 | |a Auswirkung |0 (DE-588)4112646-4 |D s |
689 | 1 | |8 1\p |5 DE-604 | |
700 | 1 | |a Ronning, Gerd |d 1939-2019 |e Sonstige |0 (DE-588)138810745 |4 oth | |
830 | 0 | |a Statistik und Wissenschaft |v 4 |w (DE-604)BV019357198 |9 4 | |
856 | 4 | 2 | |m HBZ Datenaustausch |q application/pdf |u http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=013832275&sequence=000002&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA |3 Inhaltsverzeichnis |
999 | |a oai:aleph.bib-bvb.de:BVB01-013832275 | ||
883 | 1 | |8 1\p |a cgwrk |d 20201028 |q DE-101 |u https://d-nb.info/provenance/plan#cgwrk |
Datensatz im Suchindex
_version_ | 1804134156956860416 |
---|---|
adam_text | 1
l
Inhaltsverzeichnis
i
| Abbildungsverzeichnis 18
i Tabellenverzeichnis : 20
l Vorbemerkung 34
j
I I Kurzfassung Überblick über die Leistungen des Projekts 36
j
1 Projektziele, Projekthintergrund und Projektbeteiligte 38
1.1 Projektziele 38
j 1.2 Projektbeteiligte 40
i
j 1.3 Die besondere Problemlage bei der Anonymisierung wirtschaftsstatistischer
j Einzeldaten 41
2 Überblick über die Projektarbeiten und wesentliche Projektergebnisse 43
3 Offene Fragen und weiterer Forschungsbedarf 47
3.1 Anonymisierungsverfahren und ökonometrisch statistische Methoden .... 47
3.2 Anonymisierung von Paneldaten 49
II Anonymisierungsansätze und Anonymisierungsverfahren 51
4 Abgrenzung der verschiedenen Anonymisierungsverfahren 53
i Statistisches Bundesamt, Statistik und Wissenschaft, Bd. 4/2005 5
[
Inhaltsverzeichnis 5 Verfahren zur Informationsreduktion 55
5.1 Merkmalsträgerbezogene Verfahren zur Informationsreduktion 55 |
5.2 Merkmalsbezogene Verfahren zur Informationsreduktion 57 j
5.3 Ausprägungsbezogene Verfahren zur Informationsreduktion 59 ]
6 Datenverändernde Anonymisierungsverfahren 61 j
6.1 Datenverändernde Anonymisierungsverfahren für kategoriale Variablen ... 61 [
6.1.1 Vertauschungsverfahren (Swapping) bei kategorialen Variablen ... 61
6.1.2 Post Randomisierung 61
6.1.3 Risikoorientierte Veränderung kategorialer Variablen durch das
SAFE Verfahren 64 j
6.2 Datenverändernde Anonymisierungsverfahren für metrische Variablen .... 65 |
6.2.1 Vertauschungsverfahren (Swapping) bei metrischen Variablen ... 65
6.2.2 Imputationsverfahren 66
6.2.3 Stochastische Überlagerung 67
6.2.4 Mikroaggregationsverfahren 81 |
6.2.5 Simulationsverfahren 86 j
6.3 Datenverändernde Verfahren zum Schutz besonders gefährdeter Merkmals f
träger 93 ¦¦
6.3.1 Auf einzelne Merkmalsträger beschränkte datenverändernde Ver¬
fahren 93
6.3.2 Gruppenspezifische datenverändernde Verfahren 93
6.4 Kombination unterschiedlicher datenverändernder Verfahren 94
6.4.1 Das Verfahren von Winkler 94
6.4.2 SAFE Das Verfahren des Statistischen Landesamts Berlin .... 95
j
i
7 Kriterien für die Auswahl der untersuchten Verfahren 96 1
6 Statistisches Bundesamt, Statistik und Wissenschaft, Bd. 4/2005
Inhaltsverzeichnis
III Die Projektdatensätze 102
8 Kriterien für die Auswahl der Projektdatensätze 104
9 Die eingesetzten Projektdaten 107
j
; 9.1 Die Kostenstrukturerhebung im Verarbeitenden Gewerbe und Bergbau . . . 107
9.1.1 Ziele der Kostenstrukturerhebung 107
9.1.2 Methode der Erhebung 107
9.1.3 Inhalte der Erhebung 108
9.2 Die Umsatzsteuerstatistik 110
9.2.1 Datengrundlage 110
9.2.2 Aussagekraft der Umsatzsteuerstatistik 110
9.2.3 Wirtschaftsstatistische Analysemöglichkeiten 111
9.3 Die Einzelhandelsstatistik 115
9.3.1 Ziele der Einzelhandelsstatistik 115
9.3.2 Methode der Erhebung 115
9.3.3 Inhalte der Erhebung 116
9.4 Das lAB Betriebspanel 119
IV Die Operationalisierung der Faktischen Anonymität 121
10 Der Begriff der faktischen Anonymität 123
11 Angriffsszenarien und Zusatzwissen 125
11.1 Definitionen und Bezeichnungen 125
11.2 Angriffsszenarien 126
11.3 Struktur des Zusatzwissens 127
11.3.1 Kommerzielle Unternehmensdatenbanken 128
Statistisches Bundesamt, Statistik und Wissenschaft, Bd. 4/2005 7
Inhaltsverzeichnis 11.3.2 Nichtkommerzielle Informationsquellen 130 j
11.3.3 Persönliche Informationsquellen 132 I
12 Das Konzept der Schutzwirkung 134
12.1 Korrektheit von Zuordnungsversuchen 134
12.2 Qualität enthüllter Informationen 134 j
12.3 Zusammenführung zu einem Maß für faktische Anonymität 135 j
13 Simulation von Massenfischzügen 137 j
13.1 Merkmals und Distanztypen 137
13.1.1 Metrische und kategoriale Merkmale 137 j
13.1.2 Blockmerkmale 139 j
13.2 Lineares Zuordnungsproblem 139
13.3 Greedy Heuristiken 141
13.4 Algorithmus für den Massenfischzug 143
V Die Operationalisierung des Analysepotenzials X45
14 Bestimmungsfaktoren des Analysepotenzials von Daten 147
14.1 Zur generellen Definition des Analysepotenzials 147
14.2 Informationseinschränkungen versus Ergebnisveränderung 148
14.3 Relevanz unterschiedlicher Datengrundlagen 150
14.4 Berücksichtigung unterschiedlicher Analysemethoden 151
15 Ansätze zur Messung des Analysepotenzials beim Einsatz datenverändernder
Anonymisierungsverfahren 153
15.1 Der maßzahlorientierte Ansatz 153
15.2 Der anwendungsorientierte Ansatz 157 j
8 Statistisches Bundesamt, Statistik und Wissenschaft, Bd. 4/2005
Inhaltsverzeichnis
15.3 Der theorieorientierte Ansatz 158
VI Grundsätzliches Vorgehen beim Verfahrensvergleich und bei
der Erstellung von Scientific Use Files 160
16 Das theoretisch optimale Vorgehen und Probleme in der Praxis 162
17 Untersuchung der Schutzwirkung anonymisierter Daten 165
18 Untersuchung des Analysepotenzials anonymisierter Daten 168
VII Wirkung datenverändernder Anonymisierungsmethoden auf
deskriptive Auswertungen 174
19 Auswirkungen von Mikroaggregationsverfahren und stochastischen Überlage¬
rungen auf deskriptive Auswertungen 176
19.1 Theoretische Untersuchungen 176
19.1.1 Einleitung 176
19.1.2 Auswirkungen der Mikroaggregation auf das arithmetische Mittel . 177
19.1.3 Auswirkungen der Mikroaggregation auf den Mediän und andere
Quantile 178
19.1.4 Auswirkungen stochastischer Überlagerungen auf das arithmetische
Mittel 178
19.1.5 Auswirkungen stochastischer Überlagerungen auf den Mediän und
andere Quantile 179
19.1.6 Auswirkungen von Mikroaggregation und stochastischen Überlage¬
rungen auf Streuungsmaße 180
19.1.7 Auswirkungen von Mikroaggregation und stochastischen Überlage¬
rungen auf die empirische Korrelation 182
19.1.8 Auswirkungen von Mikroaggregation und stochastischen Überlage¬
rungen auf ein Disparitätsmaß 187
Statistisches Bundesamt, Statistik und Wissenschaft, Bd. 4/2005 9
Inhaltsverzeichnis 19.2 Praxisbeispiele 190
19.3 Zusammenfassende Bewertung 194
20 Auswirkungen der Post Randomisierung auf deskriptive Auswertungen 197
20.1 Theoretische Eigenschaften 197
20.2 Praxisbeispiele 200
20.3 Ein Fazit für den Einsatz der Post Randomisierung in deskriptiven Auswer¬
tungen 201
VIII Wirkung datenverändernder Anonymisierungsmethoden bei
metrischen Variablen auf lineare und nichtlineare Modelle 202
21 Anwendungsbeispiele für lineare und nichtlineare Modelle 204
21.1 Linearisierte Cobb Douglas Produktionsfunktion mit den Daten der Kos¬
tenstrukturerhebung 204
21.2 Binäres Probit Modell zur Erklärung der Tarifbindung mit den Daten des |
lAB Betriebspanels 207 !
i
f
i
22 Stochastische Überlagerungen in linearen und nichtlinearen ökonometrischen
Modellen 211
22.1 Theoretische Eigenschaften 211
22.1.1 Stochastische Überlagerungen in linearen Modellen 211
22.1.2 Stochastische Überlagerungen in nichtlinearen Modellen 237
22.2 Monte Carlo Simulationen 249 ;
22.2.1 Stochastische Überlagerungen in linearen Modellen 249
22.2.2 Stochastische Überlagerungen in nichtlinearen Modellen 275
22.3 Praxisbeispiele 282
i
22.3.1 Stochastische Überlagerungen in linearen Modellen 282
22.3.2 Stochastische Überlagerungen in nichtlinearen Modellen 306
*® Statistisches Bundesamt, Statistik und Wissenschaft, Bd. 4/2005 ;
Inhaltsverzeichnis
l 23 Mikroaggregationsverfahren in linearen und nichtlinearen Modellen 311
I 23.1 Theoretische Eigenschaften 311
j 23.1.1 Mikroaggregationsverfahren in linearen Modellen 311
I 23.1.2 Mikroaggregationsverfahren in nichtlinearen Modellen 331
¦ 23.2 Monte Carlo Simulationen 332
! 23.2.1 Mikroaggregationsverfahren in linearen Modellen 332
i 23.2.2 Mikroaggregationsverfahren in nichtlinearen Modellen 341
; 23.3 Praxisbeispiele 344
23.3.1 Mikroaggregationsverfahren in linearen Modellen 344
23.3.2 Mikroaggregationsverfahren in nichtlinearen Modellen 358
24 Resampling in linearen Modellen 361
i 24.1 Ergebnisse von Monte Carlo Simulationen 361
i
[ 24.2 Anwendung mit Daten der Kostenstrukturerhebung 366
I
24.2.1 Notwendige Anpassung der Bandbreiten 366
24.2.2 Technische Umsetzung 367
24.3 Praxisbeispiele 368
24.4 Zusammenfassung 378
25 Latin Hypercube Sampling in linearen Modellen 379
25.1 Theoretische Eigenschaften 379
25.2 Monte Carlo Simulationen 379
25.3 Praxisbeispiele 381
26 Ein Fazit für den Einsatz von datenverändernden Verfahren auf metrische
Variablen in linearen und nichtlinearen Modellen 385
26.1 Bewertung einzelner datenverändernder Anonymisierungsverfahren 385
Statistisches Bundesamt, Statistik und Wissenschaft, Bd. 4/2005 11
Inhaltsverzeichnis 26.2 Schlussfolgerungen für den Einsatz der Verfahren zur Erstellung von
Scientific Use Files 392
IX Wirkung der Post Randomisierung in ausgewählten Modellen394
27 Post Randomisierung der abhängigen Variablen im Probit Modell 396
27.1 Ausschließliche Post Randomisierung der abhängigen Variablen im Probit
Modell 396
27.1.1 Theoretische Eigenschaften 396
27.1.2 Monte Carlo Simulationen 401
27.1.3 Praxisbeispiele 404
27.2 Post Randomisierung der abhängigen diskreten Variablen und Bearbeitung
der erklärenden metrischen mit datenverändernden Verfahren im Probit
Modell 413
27.2.1 Theoretische Eigenschaften 413
27.2.2 Monte Carlo Simulationen 414
27.2.3 Praxisbeispiele 418
28 Post Randomisierung der erklärenden diskreten Variablen in der Varianzana¬
lyse 421
28.1 Einleitung 421
28.2 Einfache Varianzanalyse mit festen und stochastischen diskreten Effekten . 422
28.2.1 Feste Effekte 422
28.2.2 Stochastische (diskrete) Effekte 424
28.2.3 Formulierung mittels r = ßi ß2 425
28.3 Randomisierte Dummy Variable (Einfache Varianzanalyse mit randomisier {
ten Effekten) 426 j
28.3.1 Einige nützliche Resultate 426
28.3.2 Inkonsistenz des OLS Schätzers bei Randomisierung 429
12 Statistisches Bundesamt, Statistik und Wissenschaft, Bd. 4/2005 ^
Inhaltsverzeichnis
28.4 Instrumentvariablen Schätzung 431
28.4.1 Binäre Instrumentvariable 431
: 28.4.2 Der IV Schätzer überschätzt den Treatment Effekt 433
28.4.3 Ein explizites Resultat 434
29 Post Randomisierung der erklärenden diskreten Variablen im Probit Modell 436
29.1 Theoretische Überlegungen 436
29.2 Praxisbeispiel 437
30 Ein Fazit für den Einsatz der Post Randomisierung in ökonometrischen Mo¬
dellen 438
X Möglichkeiten und Auswirkungen einer Beschränkung der Ano
nymisierung auf die Überschneidungsmerkmale 440
; 31 Abgrenzung der Überschneidungsmerkmale und mögliche Anonymisierungs
; Strategien 442
j 31.1 Zur Abgrenzung der Überschneidungsmerkmale 443
i 31.2 Mögliche Anonymisierungsstrategien 444
32 Implikationen für die Datensicherheit 445
32.1 Allgemeine Beurteilung verschiedener Anonymisierungsstrategien 445
32.2 Beurteilung von auf die Überschneidungsmerkmale beschränkten Mikroag
gregationsverfahren 446
33 Implikationen einer Beschränkung der Anonymisierung auf die Überschnei¬
dungsmerkmale für das Analysepotenzial 452
33.1 Allgemeine Vorbemerkungen 452
33.2 Beurteilungsschema 453
33.3 Wirkung einer „stärkeren Anonymisierung bei univariaten Auswertungen . . 455
Statistisches Bundesamt, Statistik und Wissenschaft, Bd. 4/2005 13
Inhaltsverzeichnis 33.3.1 Wirkung einer „stärkeren Mikroaggregation 455
33.3.2 Wirkung einer „stärkeren stochastischen Überlagerungen 457
33.4 Bedeutung von Überschneidungsmerkmalen und anderen Merkmalen für die
Analyse 458
33.5 Unterschiedliche Wirkung von Anonymisierungsmaßnahmen auf Über¬
schneidungsmerkmale und andere Merkmale 458
33.6 Wirkung einer „stärkeren Anonymisierung aller in multivariate Analysen
einbezogenen Merkmale 460
33.6.1 Mikroaggregationsverfahren 460
33.6.2 Stochastische Überlagerungen 461
33.7 Wirkung der Anonymisierung eines Teils der in multivariate Analysen ein¬
bezogenen Merkmale 461
33.7.1 Mikroaggregationsverfahren 461
33.7.2 Stochastische Überlagerungen 462
33.8 Wirkung einer „stärkeren Anonymisierung eines Teils der in multivariate
Analysen einbezogenen Merkmale 464
33.8.1 Mikroaggregationsverfahren 464
33.8.2 Stochastische Überlagerungen 465
34 Zusammenfassung zur Beschränkung der Anonymisierung auf die Überschnei¬
dungsmerkmale 466
34.1 Bewertung einzelner Anonymisierungsstrategien beschränkt auf die Über¬
schneidungsmerkmale 466
34.2 Fazit zur Beschränkung der Anonymisierung auf die Überschneidungsmerk¬
male 469
XI Die Anonymisierung der Projektstatistiken 471
35 Anonymisierung der Kostenstrukturerhebung im Verarbeitenden Gewerbe 473 j
I
35.1 Besonderheiten bei der Anonymisierung der Kostenstrukturerhebung .... 473 |
14 Statistisches Bundesamt, Statistik und Wissenschaft, Bd. 4/2005
Inhaltsverzeichnis
35.2 Verfügbares Zusatzwissen 475
35.2.1 Umsatzsteuerstatistik als Zusatzwissen 475
i 35.2.2 MARKUS Datenbank als Zusatzwissen 476
35.3 Anonymisierungsmaßnahmen 477
35.4 Überprüfung der Schutzwirkung 478
35.4.1 Realistische Massenfischzugszenarien 478
35.4.2 Worst Case Szenario 482
35.4.3 Zusammenführung zu einem Gesamtrisikomaß 483
35.4.4 Vergleich mit der Verfahrensgruppe multiplikative stochastische
Überlagerung 487
35.5 Überprüfung des Analysepotenzials 488
35.5.1 Vorgehensweise 488
35.5.2 Überprüfung der einzelnen Abweichungsmaße 490
35.6 Ein Scientific Use File der Kostenstrukturerhebung im Verarbeitenden Ge¬
werbe 500
; 35.6.1 Informationsreduzierende Maßnahmen 501
35.6.2 Eindimensionale getrennte Mikroaggregation 502
35.6.3 Analysepotenzial des Scientific Use Files 504
36 Anonymisierung der Umsatzsteuerstatistik 512
36.1 Besonderheiten bei der Anonymisierung der Umsatzsteuerstatistik 512
36.2 Verfügbares Zusatzwissen und Überschneidungsmerkmale 513
36.3 Anonymisierungsmaßnahmen 514
36.3.1 Kategoriale Merkmale 514
36.3.2 Metrische Merkmale 517
36.4 Überprüfung der Schutzwirkung der Anonymisierung 520
36.4.1 Der natürliche Schutz 520
Statistisches Bundesamt, Statistik und Wissenschaft, Bd. 4/2005 15
Inhaltsverzeichnis 36.4.2 Schutzwirkung der Anonymisierung 522
36.5 Überprüfung des Analysepotenzials 526
36.5.1 Überprüfung der Einhaltung der Abweichungsschwellen bei deskrip¬
tiven Maßen 526
36.5.2 Darstellung weiterer konkreter Auswertungen 530
36.6 Fazit für die faktische Anonymisierung der Umsatzsteuerstatistik 540
37 Anonymisierung der Einzelhandelsstatistik 542
37.1 Besonderheiten bei der Anonymisierung der Einzelhandelsstatistik 542
37.2 Verfügbares Zusatzwissen und Überprüfung der Datensicherheit 543
37.2.1 M+M Deutsche Handelsdatenbank 543
37.2.2 MARKUS Datenbank 544
37.2.3 Überschneidungsmerkmale bei der Einzelhandelsstatistik 546
37.3 Anonymisierungsmaßnahmen 546
37.4 Überprüfung der Schutzwirkung 547
37.4.1 Einfluss des Merkmals Anzahl der Filialen auf das Reidentifikati
onsrisiko 548
37.4.2 Detaillierte Analyse der Mikroaggregationsvarianten 549
37.4.3 Vergleich von Mikroaggregation und stochastischer Überlagerung . 558
37.4.4 Einzelangriffe 560
37.5 Überprüfung des Analysepotenzials 563
37.5.1 Vorgehen 563
37.5.2 Untersuchung der einzelnen Abweichungsmaße 563
37.5.3 Schlussfolgerungen für die Anonymisierung der Einzelhandelsstatis¬
tik aus Sicht des Analysepotenzials 567
37.6 Zwei Scientific Use Files der Einzelhandelsstatistik 1999 567 }
37.6.1 Erzeugung eines Scientific Use Files für die kleinen Unternehmen f
der Einzelhandelsstatistik 1999 567
16 Statistisches Bundesamt, Statistik und Wissenschaft, Bd. 4/2005 ,
Inhaltsverzeichnis
37.6.2 Erzeugung eines Scientific Use Files für alle Unternehmen der Ein¬
zelhandelsstatistik 1999 570
XII Zusammenfassung: Handlungsempfehlungen für kommende
Anonymisierungsprojekte 575
Anhang 578
A Eigene Workshops 579
B Beteiligung an Konferenzen und Tagungen 587
C Fachveröffentlichungen 595
Literatur 600
Index 609
Statistisches Bundesamt, Statistik und Wissenschaft, Bd. 4/2005 17
Abbildungsverzeichnis
4.1 Ansätze der Veränderung von Mikrodaten 54
7.1 Übersicht der Anonymisierungsverfahren 98
11.1 Überschneidungsmerkmale . . 125
13.1 Vergröberung von Wirtschaftsklassen 138
13.2 Eindeutige Zuordnungen 144
16.1 Prozess zur Erstellung eines Scientific Use Files 164
17.1 Vorgehen bei der Untersuchung der Schutzwirkung anonymisierter Daten . 167
22.1 SIMEX Schätzer im einfachen linearen Modell Lineare Extrapolations¬
funktion 241
22.2 SIMEX Schätzer im einfachen linearen Modell Quadratische Extrapolati¬
onsfunktion 242
22.3 SIMEX Schätzer im einfachen linearen Modell Rational lineare (nichtli¬
neare) Extrapolationsfunktion (Kurve wird von STATA nicht ausgewiesen) . 243
27.1 Relative Fehler von PRAM korrigierten ML Schätzungen in Abhängigkeit
von variierenden Wechselwahrscheinlichkeiten. Schätzungen für Deutsch
land und Baden Württemberg im Vergleich 409
18 Statistisches Bundesamt, Statistik und Wissenschaft, Bd. 4/2005
Abbildungsverzeichnis
27.2 Boxplots der Verteilungen der geschätzten Koeffizienten für die logarith
mierte Beschäftigung einfaches PRAM mit Wechselswahrscheinlichkeiten
von 2%, 14% und 30%, Deutschland, 500 Replikationen 410
27.3 Anteile der „richtigen Entscheidungen hinsichtlich der statistischen Signifi¬
kanz der Koeffizienten (5% Niveau) für variierende Werte der Wechselwahr¬
scheinlichkeiten, einfaches PRAM, Deutschland und Baden Württemberg
im Vergleich, jeweils vollständige Stichprobe und 50% Sample, 500 Repli¬
kationen 412
27.4 Vergleich von einfachem PRAM und einfachem PRAM mit Mikroaggrega
tion, 500 Replikationen 420
27.5 Vergleich der Anteile der „richtigen Entscheidungen hinsichtlich der statis¬
tischen Signifikanz der Koeffizienten auf dem 5% Niveau, einfache PRAM
ohne und mit Mikroaggregation (von 3 oder 15 Beobachtungen) 420
28.1 Randomisierte binäre Regressorvariable Xa 422
33.1 Schema uni und multivariate Auswertungen 454
35.1 Enthüllungsrisiken verschiedener Szenarien 485
; 35.2 Vergleich der Schutzwirkung verschiedener Mikroaggregationsverfahren . . 486
Statistisches Bundesamt, Statistik und Wissenschaft, Bd. 4/2005 19
Tabellenverzeichnis
9.1 Fallzahlen nach ausgewählten Merkmalen (KSE) 108
9.2 Merkmale des Datensatzes der Kostenstrukturerhebung 109
9.3 Datensatzbeschreibung der Projektstatistik Umsatzsteuerstatistik 2000 . . 113
9.4 Ausprägungen 114
9.5 Rechtsformen 114
9.6 Merkmale des Datensatzes der Einzelhandelsstatistik 118
11.1 Auswahl an Unternehmensdatenbanken 129
13.1 Beispiel 144
19.1 Veränderung von Verteilungsmaßen der KSE durch verschiedene Mikroag
gregationsverfahren, Datengrundlage: gesamte KSE 1999 192
19.2 Veränderung von Verteilungsmaßen der KSE durch verschiedene stochas
tische Überlagerungen und getrennte Mikroaggregation, Datengrundlage:
KSE 1999 ohne Wirtschaftszweig 37 (Recycling) 193
20.1 Auswirkungen der Post Randomisierung auf deskriptive Auswertungen . . .200
21.1 Kenngrößen der Anteile der Inputfaktoren am Output (Datensatz bereinigt) 206
21.2 Kenngrößen der Anteile der Inputfaktoren am Output (ohne Wirtschafts¬
zweig Recycling), Datensatz bereinigt 206 :
21.3 Cobb Douglas Produktionsfunktion: Schätzergebnisse für die Originalwerte j
der KSE 1999 207 f
20 Statistisches Bundesamt, Statistik und Wissenschaft, Bd. 4/2005
Tabellenverzeichnis
21.4 Cobb Douglas Produktionsfunktion Schätzergebnisse für die Originalwer¬
te der KSE 1999 (ohne Wirtschaftszweig Recycling) 208
21.5 Deskriptive Statistik, ungewichtete Daten 209
21.6 ML Probitschätzung zur Erklärung der Tarifbindung mit Orignaldaten . . . 210
22.1 MC Simulationen Lineares Modell, einfache additive Überlagerung, alle
Variablen anonymisiert, 1.000 Replikationen 253
22.2 MC Simulationen Lineares Modell, additive Überlagerung mit proportio¬
naler Varianz Kovarianzmatrix und Kim Verfahren, alle Variablen anonymi¬
siert, 1.000 Replikationen 254
22.3 MC Simulationen Lineares Modell, multiplikative Überlagerung (Gleich¬
verteilung (0,5;l,5)), alle Variablen anonymisiert, 1.000 Replikationen . . . 255
22.4 MC Simulationen Lineares Modell, multiplikative Überlagerung (Gleich¬
verteilung (0,5;l,5)) mit Transformation zum Erhalt der ersten und zweiten
Momente, alle Variablen anonymisiert, 1.000 Replikationen 256
22.5 MC Simulationen Lineares Modell, multiplikative Überlagerung nach dem
Verfahren von Höhne, alle Variablen anonymisiert, 1.000 Replikationen . . . 257
22.6 MC Simulationen Lineares Modell, additive (NV) und multiplikative (GV)
Überlagerung, nur abhängige Variable anonymisiert, 1.000 Replikationen . . 258
22.7 MC Simulationen Lineares Modell, additive Überlagerung (NV) mit pro¬
portionaler Varianz Kovarianzmatrix und multiplikative Überlagerung (GV)
mit konstantem Faktor, nur Regressoren anonymisiert, 1.000 Replikationen 259
22.8 MC Simulationen Lineares Modell, additive Überlagerung (NV) mit pro¬
portionaler Varianz Kovarianzmatrix und multiplikative Überlagerung (GV)
mit konstantem Faktor, abhängige und zwei erklärende Variablen anonymi¬
siert, 1.000 Replikationen 260
22.9 MC Simulationen Lineares Modell, Kim Verfahren und multiplikative
Überlagerung (GV), konstante Faktoren mit Kim Transformation, nur Re¬
gressoren anonymisiert, 1.000 Replikationen 261
22.10MC Simulationen Lineares Modell, Kim Verfahren und multiplikative
Überlagerung (GV), konstante Faktoren mit Kim Transformation, abhän¬
gige und zwei erklärende Variablen anonymisiert, 1.000 Replikationen . . . 262
22.11MC Simulationen Lineares Modell, multiplikative Überlagerung nach dem
Verfahren von Höhne, nur Regressoren anonymisiert, 1.000 Replikationen . 263
Statistisches Bundesamt, Statistik und Wissenschaft, Bd. 4/2005 21
Tabellenverzeichnis . .
22.12MC Simulationen Lineares Modell, multiplikative Überlagerung nach dem
Verfahren von Höhne, abhängige und zwei erklärende Variablen anonymi
siert, 1.000 Replikationen 264
22.13MC Simulationen Lineares Modell, multiplikative Überlagerung nach dem
Verfahren von Höhne, zwei Regressoren anonymisiert, 1.000 Replikationen . 265
22.14MC Simulationen Lineares Modell mit logarithmierten Variablen, additive
Überlagerung (NV) mit gleichen Zufallszahlen, 1.000 Replikationen .... 269
22.15MC Simulationen Lineares Modell mit logarithmierten Variablen, additive
Überlagerung (NV) mit unterschiedlichen Zufallszahlen, 1.000 Replikationen 270
22.16MC Simulationen Lineares Modell mit logarithmierten Variablen, additive
Überlagerung (NV) nach dem Kim Verfahren, 1.000 Replikationen 271
22.17MC Simulationen Lineares Modell mit logarithmierten Variablen, multi¬
plikative Überlagerung (GV) mit konstanten Faktoren, 1.000 Replikationen 272
22.18MC Simulationen Lineares Modell mit logarithmierten Variablen, multi¬
plikative Überlagerung (GV) mit unterschiedlichen Faktoren, 1.000 Repli¬
kationen 273
22.19MC Simulationen Lineares Modell mit logarithmierten Variablen, multi¬
plikative Überlagerung nach dem Varfahren von Höhne, 1.000 Replikationen 274
22.20MC Simulationen Probit Modell, additive stochastische Überlagerung
(Normalverteilung), alle Regressoren überlagert, 1.000 Replikationen .... 276
22.21MC Simulationen Probit Modell, multiplikative stochastische Überlage¬
rung (Gleichverteilung), alle Regressoren überlagert, 1.000 Replikationen . 277
22.22MC Simulationen Probit Modell, multiplikative stochastische Überlage¬
rung (Mischungsverteilung nach dem Verfahren von Höhne), alle Regres¬
soren überlagert, 1.000 Replikationen 278
22.23MC Simulationen Probit Modell, additive stochastische Überlagerung
(NV), Teil der Regressoren überlagert, 1.000 Replikationen 279
22.24MC Simulationen Probit Modell, multiplikative stochastische Überlage¬
rung (Gleichverteilung), Teil der Regressoren überlagert, 1.000 Replikationen280
22.25MC Simulationen Probit Modell, multiplikative stochastische Überlage •
rung (Mischungsverteilung nach dem Verfahren von Höhne), zwei der Re )
gressoren überlagert, 1.000 Replikationen 281 f
i
22 Statistisches Bundesamt, Statistik und Wissenschaft, Bd. 4/2005 I
Tabellenverzeichnis
22.26Linearisierte Cobb Douglas Produktionsfunktion Schätzergebnisse für ad¬
ditiv überlagerte KSE Daten (ohne Wirtschaftszweig Recycling), Datensatz
bereinigt, 1.000 Replikationen, Logarithmen überlagert, robuste Standard¬
fehler 286
22.27Linearisierte Cobb Douglas Produktionsfunktion Schätzergebnisse für
multiplikativ (Gleichvert.(0,5;l,5)) überlagerte KSE Daten (ohne Wirt¬
schaftszweig Recycling), Datensatz bereinigt, 1.000 Replikationen, Loga¬
rithmen überlagert, robuste Standardfehler 287
22.28Linearisierte Cobb Douglas Produktionsfunktion Schätzergebnisse für
multiplikativ (Gleichvert.(0,8;l,2)) überlagerte KSE Daten (ohne Wirt¬
schaftszweig Recycling), Datensatz bereinigt, 1.000 Replikationen, Loga¬
rithmen überlagert, robuste Standardfehler 288
22.29Linearisierte Cobb Douglas Produktionsfunktion Schätzergebnisse für
multiplikativ (Verfahren von Höhne) überlagerte KSE Daten (ohne Wirt¬
schaftszweig Recycling), Datensatz bereinigt, 1.000 Replikationen, Loga¬
rithmen überlagert, robuste Standardfehler 289
22.30Linearisierte Cobb Douglas Produktionsfunktion Schätzergebnisse für ad¬
ditiv (NV) überlagerte KSE Daten (ohne Wirtschaftszweig Recycling), Da¬
tensatz unbereinigt, 1.000 Replikationen, Inputfaktoren und Output über
lagert, robuste Standardfehler 293
22.31Linearisierte Cobb Douglas Produktionsfunktion Schätzergebnisse für
mit dem Kim Verfahren additiv (NV) überlagerte KSE Daten (ohne Wirt¬
schaftszweig Recycling), Datensatz unbereinigt, 1.000 Replikationen, In¬
putfaktoren und Output überlagert, robuste Standardfehler 294
22.32Linearisierte Cobb Douglas Produktionsfunktion Schätzergebnisse für
multiplikativ (Gleichvert. (0,5;l,5)) überlagerte KSE Daten (ohne Wirt¬
schaftszweig Recycling), Datensatz unbereinigt, 1.000 Replikationen, In¬
putfaktoren und Output überlagert, robuste Standardfehler 295
22.33Linearisierte Cobb Douglas Produktionsfunktion Schätzergebnisse für
multiplikativ (Gleichvert. (0,8;l,2)) überlagerte KSE Daten (ohne Wirt¬
schaftszweig Recycling), Datensatz unbereinigt, 1.000 Replikationen, In¬
putfaktoren und Output überlagert, robuste Standardfehler 296
22.34Linearisierte Cobb Douglas Produktionsfunktion Schätzergebnisse für
multiplikativ (Verfahren von Höhne) überlagerte KSE Daten (ohne Wirt¬
schaftszweig Recycling), Datensatz unbereinigt, 1.000 Replikationen, In¬
putfaktoren und Output überlagert, robuste Standardfehler 297
Statistisches Bundesamt, Statistik und Wissenschaft, Bd. 4/2005 23
Tabellenverzeichnis _____ 22.35Linearisierte Cobb Douglas Produktionsfunktion Schätzergebnisse für
stochastisch überlagerte KSE Daten (ohne Wirtschaftszweig Recycling),
Datensatz unbereinigt, Ausgangsvariablen überlagert, robuste Standardfehler301
22.36Linearisierte Cobb Douglas Produktionsfunktion Schätzergebnisse für
stochastisch überlagerte KSE Daten (ohne Wirtschaftszweig Recycling),
Datensatz bereinigt, Ausgangsvariablen überlagert, robuste Standardfehler . 302
22.37Linearisierte Cobb Douglas Produktionsfunktion Schätzergebnisse für
multiplikativ überlagerte KSE Daten, Mischungsverteilung nach dem Ver¬
fahren von Höhne (ohne Wirtschaftszweig Recycling), Datensatz unberei¬
nigt, Ausgangsvariablen überlagert, robuste Standardfehler 303
22.38Linearisierte Cobb Douglas Produktionsfunktion Schätzergebnisse für
multiplikativ überlagerte KSE Daten, Mischungsverteilung nach dem Ver¬
fahren von Höhne (ohne Wirtschaftszweig Recycling), Datensatz bereinigt,
Ausgangsvariablen überlagert, robuste Standardfehler 304
22.39Linearisierte Cobb Douglas Produktionsfunktion Schätzergebnisse für
multiplikativ überlagerte KSE Daten (ohne Wirtschaftszweig Recycling)
Mischungsverteilung nach dem Verfahren von Höhne, Beschränkung auf
für Originaldaten, anonymisierte Daten und Instrumente definierte Loga¬
rithmen, Ausgangsvariablen überlagert, robuste Standardfehler 305
22.40Probit Schätzung zur Erklärung der Tarifbindung Schätzergebnisse für
additiv stochastisch überlagerte Daten des lAB Betriebspanels 2002 für
Baden Württemberg, 500 Replikationen 307
22.41Probit Schätzung zur Erklärung der Tarifbindung Schätzergebnisse für
multiplikativ stochastisch überlagerte Daten des lAB Betriebspanels 2002
für Baden Württemberg, logarithmierte Beschäftigung überlagert, 500 Re¬
plikationen 308
22.42Probit Schätzung zur Erklärung der Tarifbindung Schätzergebnisse für
multiplikativ stochastisch überlagerte Daten des lAB Betriebspanels 2002
für Baden Württemberg, Beschäftigung überlagert, 500 Replikationen . . 309
23.1 MC Simulationen Lineares Modell, unterschiedliche Varianten der Mikro
aggregation, alle Variablen anonymisiert, 1.000 Replikationen 335
23.2 MC Simulationen Lineares Modell, zufällige Mikroaggregation, nur ab
hängige Variable anonymisiert sowie nur Regressoren anonymisiert, 1.000
Replikationen 336 I
24 Statistisches Bundesamt, Statistik und Wissenschaft, Bd. 4/2005 I
Tabellenverzeichnis
23.3 MC Simulationen Lineares Modell, unterschiedliche Varianten der Mikro
aggregation, abhängige und zwei erklärende Variablen anonymisiert, 1.000
Replikationen 337
23.4 MC Simulationen Lineares Modell, unterschiedliche Varianten der Mikro
aggregation, zwei Regressoren anonymisiert, 1.000 Replikationen 338
23.5 MC Simulationen Lineares Modell mit logarithmierten Variablen, verschie¬
dene Varianten der Mikroaggregation, 1.000 Replikationen 340
23.6 MC Simulationen Probit Modell, unterschiedliche Varianten der Mikro¬
aggregation, alle Regressoren mikroaggregiert, 1.000 Replikationen .... 342
23.7 MC Simulationen Probit Modell, unterschiedliche Varianten der Mikro¬
aggregation, Teil der Regressoren mikroaggregiert, 1.000 Replikationen . . 343
23.8 Automatische Gruppierung der Merkmale der KSE für gruppierte Mikroag¬
gregation MAIIG 346
23.9 Gruppierung der Merkmale der KSE für gruppierte Mikroaggregation MA8G 347
23.10Getestete Varianten der Mikroaggregation 349
23.11Linearisierte Cobb Douglas Produktionsfunktion Schätzergebnisse für ab
standsorientiert mikroaggregierte KSE Daten, Datensatz bereinigt, robuste
Standardfehler . . 349
23.12Linearisierte Cobb Douglas Produktionsfunktion Schätzergebnisse für ge¬
trennt abstandsorientiert mikroaggregierte KSE Daten, Datensatz berei¬
nigt, robuste Standardfehler 351
23.13Linearisierte Cobb Douglas Produktionsfunktion Schätzergebnisse für ge¬
meinsam abstandsorientiert mikroaggregierte KSE Daten, Datensatz berei¬
nigt, robuste Standardfehler 352
23.14Linearisierte Cobb Douglas Produktionsfunktion Schätzergebnisse für ge¬
meinsam zufällig mikroaggregierte KSE Daten, Datensatz bereinigt, robu¬
ste Standardfehler 353
23.15Linearisierte Cobb Douglas Produktionsfunktion Schätzergebnisse für
mit Bootstrap Mikroaggregation bearbeitete KSE Daten, Datensatz berei¬
nigt, robuste Standardfehler 354
23.16Korrelationskoeffizienten zwischen dem logarithmierten Output und den
logarithmierten Inputgrößen 354
Statistisches Bundesamt, Statistik und Wissenschaft, Bd. 4/2005 25
Tabellenverzeichnis .
23.17Linearisierte Cobb Douglas Produktionsfunktion Schätzergebnisse für
mit verschiedenen Varianten der Mikroaggregation bearbeitete KSE Daten,
Mikroaggregation nach Bereinigung, Logarithmen des Outputs und der In
putfaktoren mikroaggregiert, robuste Standardfehler 355
23.18Linearisierte Cobb Douglas Produktionsfunktion Schätzergebnisse für
mit verschiedenen Varianten der Mikroaggregation bearbeitete KSE Daten,
Mikroaggregation nach Bereinigung, Logarithmen des Outputs und der In
putfaktoren mikroaggregiert, Mikroaggregation nach Zellen, robuste Stan¬
dardfehler 356
23.19Lineariserte Cobb Douglas Produktionsfunktion Schätzergebnisse für mit
verschiedenen Varianten der getrennten abstandsorientierten Mikroaggre¬
gation bearbeitete KSE Daten, Daten bereinigt, Ausgangsvariablen anony
misiert, robuste Standardfehler 357
23.20Linearisierte Cobb Douglas Produktionsfunktion Schätzergebnisse für
mit verschiedenen Varianten der gemeinsamen abstandsorientierten Mik¬
roaggregation bearbeitete KSE Daten, Daten bereinigt, Ausgangsvariablen
anonymisiert, robuste Standardfehler 357
23.21Probit Schätzung zur Erklärung der Tarifbindung Schätzergebnisse
für mikroaggregierte Daten des lAB Betriebspanels 2002 für Baden
Würtemberg, bei stochastischen Verfahren 1.000 Replikationen 359
24.1 MC Simulationen, Resampling OLS Schätzergebnisse im Vergleich,
Resampling Verfahren mit verschiedenen Bandbreitenfaktoren (BBF) (100
Wiederholungen) 365
24.2 Cobb Douglas Produktionsfunktion OLS Schätzergebnisse mit den Ori¬
ginaldaten der KSE 1999 369
24.3 Cobb Douglas Produktionsfunktion OLS Schätzergebnisse mit den uni
variaten Resamples (ohne Extremwertbereinigung) der KSE 1999 372
24.4 Cobb Douglas Produktionsfunktion OLS Schätzergebnisse mit den mul
tivanaten Resamples (ohne Extremwertbereinigung) der KSE 1999 373
24.5 Cobb Douglas Produktionsfunktion OLS Schätzergebnisse mit den mul
tivanaten Resamples (mit Clusterbildung und ohne Extremwertbereinigung)
der KSE 1999 374
24.6 Cobb Douglas Produktionsfunktion OLS Schätzergebnisse mit robusten
Standardfehlern (ohne Extremwertbereinigung) der KSE 1999 375 •
26 Statistisches Bundesamt, Statistik und Wissenschaft, Bd. 4/2005 |
i
Tabellenverzeichnis
24.7 Cobb Douglas Produktionsfunktion OLS Schätzergebnisse mit robusten
Standardfehlern (mit Extremwertbereinigung) der KSE 1999 376
24.8 Cobb Douglas Produktionsfunktion OLS Schätzergebnisse mit vor dem
Resampling logarithmierten Variablen (ohne Extremwertbereinigung) der
KSE 1999 377
25.1 MC Simulationen Lineares Modell mit logarithmierten Variablen, LHS,
alle Variablen anonymisiert, 100 Replikationen 380
25.2 Linearisierte Cobb Douglas Produktionsfunktion Schätzergebnisse für
mit LHS bearbeitete KSE Daten, Daten nicht bereinigt, robuste Standard¬
fehler 382
26.1 Additive stochastische Überlagerung und lineare Modelle 386
26.2 Multiplikative stochastische Überlagerung und lineare Modelle 386
26.3 Mikroaggregation und lineare Modelle 387
27.1 Ergebnisse der Monte Carlo Simulationen für einfaches PRAM im Probit
Modell 403
27.2 Ergebnisse der Monte Carlo Simulationen für invariantes PRAM im Probit
Modell 404
27.3 Vergleich von Originalschätzung, naiver Probitschätzung bei anonymi
sierten Daten und PRAM korrigierter ML Probitschätzung für variieren¬
de Tauschwahrscheinlichkeiten, MC Simulationen mit 500 Replikationen,
Deutschland 406
27.4 Vergleich von Originalschätzung, naiver Probitschätzung bei anonymi
sierten Daten und PRAM korrigierter ML Probitschätzung für variieren¬
de Tauschwahrscheinlichkeiten, MC Simulationen mit 500 Replikationen,
Baden Württemberg 407
27.5 MC Simulationen Post Randomisierung der abhängigen Variablen und
additive stochastische Überlagerung im Probit Modell (a^ = 0,01,n =
500, 500 Replikationen), SIMEX Schätzer und PRAM Korrektur 415
27.6 MC Simulationen Post Randomisierung der abhängigen Variablen und
additive stochastische Überlagerung im Probit Modell (er;; = 0,25, n =
500, 500 Replikationen), SIMEX Schätzer und PRAM Korrektur 415
Statistisches Bundesamt, Statistik und Wissenschaft, Bd. 4/2005 27
Tabellenverzeichnis __ 27.7 MC Simulationen Post Randomisierung der abhängigen Variablen und
Mikroaggregation der Regressorvariablen im Probit Modell, 1.000 Replika
tionen 417
27.8 Vergleich des einfachen PRAM und des einfachen PRAM mit zusätzlicher
Mikroaggregation der logarithmierten Beschäftigung, PRAM korrigierte
ML Probit Schätzung für eine Wechselwahrscheinlichkeit von 20% Er¬
gebnisse von MC Simulationen mit 500 Replikationen 419
28.1 Gemeinsame Verteilung von X und Y 427
28.2 Gemeinsame Verteilung von X und V 428
28.3 Bias Faktor cov(Xa, V) / var(Xa) 430
28.4 Gemeinsame Verteilung von X und Z 431
28.5 Gemeinsame Verteilung von V und Z 432
29.1 Probit Schätzung zur Erklärung der Tarifbindung Dummy Variablen für
Verarbeitendes Gewerbe und Baugewerbe mit PRAM anonymisiert, IAB
Betriebspanel 2002 für Baden Württemberg, 500 Replikationen 437
32.1 Enthüllungsrisiken (MARKUS Datenbank) 447
32.2 Enthüllungsrisiken (Worst Case) 448
32.3 Gesamtergebnis der Reidentifikationsversuche 449
32.4 Falschzuordnungsquoten nach Unternehmensgröße 450
32.5 Vergleich der Anzahl an Reidentifikationen 451
33.1 Anteil der Überschreitungen der Abweichungsschwellen bei den Überschnei¬
dungsmerkmalen der KSE im weiteren Sinne bei Mikroaggregationsverfahren456
33.2 Anteil der Überschreitungen der Abweichungsschwellen bei den Überschnei¬
dungsmerkmalen der KSE im weiteren Sinne bei multiplikativen stochasti
schen Überlagerungen 457
33.3 Maximale relative Abweichung der arithmetischen Mittel für die einzelnen
Variablen in den kleinstmöglichen Zellen (nach Wirtschaftszweigen, Be¬
schäftigtengrößenklassen, Ost/West) 459
33.4 Modellvariablen und ihre Behandlung durch die Mikroaggregation 462
28 Statistisches Bundesamt, Statistik und Wissenschaft, Bd. 4/2005
Tabellenverzeichnis
33.5 Abweichung der Parameterschätzer, linearisierte Cobb Douglas
Produktionsfunktion, KSE Daten für KMU, unterschiedlich viele
mikroaggregierte Merkmale 463
33.6 Abweichung der Parameterschätzer, linearisierte Cobb Douglas
Produktionsfunktion, KSE Daten für KMU, für unterschiedliche Vor¬
gehensweisen bei der Mikroaggregation 465
34.1 Gemeinsame Mikroaggregation und Erwartungstreue im linearen Modell . . 467
35.1 Ausschnitt der Kostenstrukturerhebung 474
35.2 Verteilung der Unternehmen auf Beschäftigtengrößenklassen 474
35.3 Verteilung der überprüfbaren Unternehmen auf Beschäftigtengrößenklassen 476
35.4 Verteilung der MARKUS Unternehmen auf Beschäftigtengrößenklassen . . 477
35.5 Reidentifikationen (Umsatzsteuerstatistik) nach Beschäftigtengrößenklassen 479
35.6 Reidentifikationen (MARKUS) nach Beschäftigtengrößenklassen 481
35.7 Reidentifikationen (Worst Case) nach der Anzahl der Überschneidungs¬
merkmale 482
35.8 Reidentifikationen (Worst Case) mit einem Überschneidungsmerkmal nach
Beschäftigtengrößenklassen 483
35.9 Reidentifikationen (Worst Case) mit zwei Überschneidungsmerkmalen nach
Beschäftigtengrößenklassen 484
35.10Enthüllungsrisiken auf dem Niveau 7 = 0,05 484
35.11Enthüllungsrisiken auf dem Niveau 7 = 0, 05 nach Beschäftigtengrößen¬
klassen 486
35.12Varianten multiplikativer stochastischer Überlagerung 488
35.13Reidentifikationsrisiken aller Anonymisierungsvarianten 488
35.14Enthüllungsrisiken aller Anonymisierungsvarianten 489
35.^Durchschnittliche Veränderung der Verteilungsmaße 491
35.16Veränderung der univariaten Verteilungsmaße 492
35.17Veränderung der Korrelationen 493
Statistisches Bundesamt, Statistik und Wissenschaft, Bd. 4/2005 29
Tabellenverzeichnis 35.18Veränderung der Verteilungsmaße nach Wirtschaftszweigen 494
35.19Veränderung der Verteilungsmaße nach Ost/West 495
35.20Veränderung der Verteilungsmaße nach Ost/West und Wirtschaftszweigen 496
35.21t Tests auf Mittelwertgleichheit (ungewichtet) für Teilgesamtheiten .... 497
35.22t Tests auf Mittelwertgleichheit (gewichtet) für Teilgesamtheiten 498
35.23Verteilung von Gesamtumsatz und Beschäftigten auf Wirtschaftsabteilungen503
35.24Durchschnittliche Veränderung der Verteilungsmaße 504
35.25Veränderung der univariaten Verteilungsmaße 504
35.26Veränderung der Korrelationen 505
35.27Veränderung der Verteilungsmaße für Teilgesamtheiten 505
35.28t Tests auf Mittelwertgleichheit für Teilgesamtheiten 506
35.29Beispielhafte Auswertungen nach Beschäftigtengrößenklassen 507
35.30Linearisierte Cobb Douglas Produktionsfunktion OLS Regression, robu¬
ste Standardfehler (um Ausreißer bereinigt) für die kleineren und mittleren
Unternehmen der KSE 508
35.31Linearisierte Cobb Douglas Produktionsfunktion Fahrzeugbau OLS
Regression für die kleineren und mittleren Unternehmen der KSE, robuste
Standardfehler (um Ausreißer bereinigt) 509
35.32Linearisierte Cobb Douglas Produktionsfunktion Maschinenbau OLS
Regression für die kleineren und mittleren Unternehmen der KSE, robuste
Standardfehler (um Ausreißer bereinigt) 510
35.33Linearisierte Cobb Douglas Produktionsfunktion mit Dummy Variablen für
einzelne Wirtschaftszweige OLS Regression für die kleineren und mittleren
Unternehmen der KSE, robuste Standardfehler (um Ausreißer bereinigt). . 511
36.1 Ausgewiesene Wirtschaftsbereiche im Scienitfic Use File Umsatzsteuersta¬
tistik 2000, Teil I 516
36.2 Ausgewiesene Wirtschaftsbereiche im Scienitfic Use File Umsatzsteuersta¬
tistik 2000, Teil II 517
36.3 Datensatzbeschreibung des Scientific Use Files der Umsatzsteuerstatistik
2000 519
30 Statistisches Bundesamt, Statistik und Wissenschaft, Bd. 4/2005
Tabellenverzeichnis
36.4 Abweichungen in den Merkmalsausprägungen zwischen Zusatzwissen und
Zieldaten 521
36.5 Enthüllungsrisiko bei der Umsatzsteuerstatistik im Szenario I 523
36.6 Enthüllungsrisiko bei der Umsatzsteuerstatistik im Szenario IM 524
36.7 Durchschnittliche Veränderung der Verteilungsmaße 527
36.8 Veränderung der univariaten Verteilungsmaße . 527
36.9 Veränderung der Korrelationen 527
36.10Veränderung von Streuungsmaßen für unterschiedliche Arten der Anonymi
sierung sowie eine Teilgesamtheit der Kleinunternehmen im Vergleich zum
Gesamtdatensatz 528
36.HVeränderung von Verteilungsmaßen für Teilgesamtheiten 529
36. ^Steuerpflichtige, Lieferungen und Leistungen nach Wirtschaftszweigen . . . 531
36.^Steuerpflichtige, Lieferungen und Leistungen nach Umsatzgrößenklassen . . 533
36.14Absolute Konzentrationsmaße der Wirtschaftszweige des Abschnitts K
„Grundstücks und Wohnungswesen, Vermietung beweglicher Sachen, Er¬
bringung von wirtschaftlichen Dienstleistungen, anderweitig nicht genannt 535
36.15Gini Koeffizienten für die Wirtschaftszweige des Abschnitts K
„Grundstücks und Wohnungswesen, Vermietung beweglicher Sachen,
Erbringung von wirtschaftlichen Dienstleistungen, anderweitig nicht genannt 536
36.16Exportquoten der Wirtschaftszweige des Abschnitts K „Grundstücks und
Wohnungswesen, Vermietung beweglicher Sachen, Erbringung von wirt¬
schaftlichen Dienstleistungen, anderweitig nicht genannt 538
36.17Exportquoten nach Größenklassen 539
36.18Die zehn Branchen mit dem höchsten Umsatzanteil zu 7% Umsatzsteuer . 540
37.1 Vergleich kategorialer Überschneidungsmerkmale bei Originaldaten und
MARKUS Datenbank 545
37.2 Vergleich metrischer Überschneidungsmerkmale bei Originaldaten und
MARKUS Datenbank 546
37.3 Relative Trefferquoten nach Beschäftigtengrößenklassen mit den Varianten
1 bis 3 54g
Statistisches Bundesamt, Statistik und Wissenschaft, Bd. 4/2005 31
Tabellenverzeichnis ____
37.4 Kategorien des Merkmals Anzahl der Filialen 549
37.5 Relative Trefferquoten nach Beschäftigtengrößenklassen mit Zusatzwissen
„Originaldaten 550
37.6 Relative Trefferquoten nach Beschäftigtengrößenklassen mit Zusatzwissen
„MARKUS Datenbank 551
37.7 Relative Trefferquoten nach Beschäftigtengrößenklassen mit Zusatzwissen
„Umsatzsteuerstatistik 551
37.8 Nützlichkeit nach Beschäftigtengrößenklassen mit Zusatzwissen „Original¬
daten 552
37.9 Nützlichkeit nach Beschäftigtengrößenklassen mit Zusatzwissen
„MARKUS Datenbank 552
37.10Nützlichkeit nach Beschäftigtengrößenklassen mit Zusatzwissen „Umsatz¬
steuerstatistik 552
37.11Enthüllungsrisiken mit WZ Dreisteller und BBR9 554
37.12Enthüllungsrisiken mit WZ Viersteller und BBR9 555
37.13Enthüllungsrisiken mit WZ Viersteller und BBR3 556
37.14Enthüllungsrisiken mit WZ Dreisteller und BBR3 557
37.15Enthüllungsrisiken nach Beschäftigtengrößenklassen für verschiedene Ano
nymisierungsverfahren 559
37.16EinzelangrifFe mit Zusatzwissen „Internet 561
37.17Einzelangriffe mit Zusatzwissen „MARKUS Datenbank 562
37.18Einzelangriffe mit Zusatzwissen „Internet und „MARKUS Datenbank . . . 562
37.19Veränderung der univariaten Verteilungsmaße 564
37.20Veränderungsraten der univariaten Verteilungsmaße 564
37.21Veränderungsraten der Korrelationen 564
37.22Veränderung der Verteilungsmaße einzelner Wirtschaftszweige 565
37.23Veränderung der Verteilungsmaße nach Ost/West 565
37.24Veränderung der Verteilungsmaße nach Wirtschaftszweigen und Ost/West 565
37.25Ergebnisse von t Tests auf Mittelwertgleichheit für Teilgesamtheiten .... 566
32 Statistisches Bundesamt, Statistik und Wissenschaft, Bd. 4/2005
Tabellenverzeichnis
37.26Die Tiefe der WZ Klassifikation bei den Scientific Use Files 569
37.27Enthüllungsrisiken für ost und westdeutsche Unternehmen 570
37.28Enthüllungsrisiken nach Beschäftigtengrößenklassen 572
37.29Durchschnittliche Veränderung der Verteilungsmaße 572
37.30Veränderung der univariaten Verteilungsmaße 573
37.31Veränderung der Korrelationen 573
37.32Veränderung der Verteilungsmaße für die Wirtschaftszweige 573
37.33t Tests auf Mittelwertgleichheit für die Wirtschaftszweige 573
37.34Merkmale der Scientific Use Files 574
Statistisches Bundesamt, Statistik und Wissenschaft, Bd. 4/2005 33
|
any_adam_object | 1 |
author_GND | (DE-588)138810745 |
building | Verbundindex |
bvnumber | BV020827001 |
classification_rvk | QH 200 |
ctrlnum | (OCoLC)163431049 (DE-599)BVBBV020827001 |
dewey-full | 310 |
dewey-hundreds | 300 - Social sciences |
dewey-ones | 310 - Collections of general statistics |
dewey-raw | 310 |
dewey-search | 310 |
dewey-sort | 3310 |
dewey-tens | 310 - Collections of general statistics |
discipline | Wirtschaftswissenschaften |
format | Book |
fullrecord | <?xml version="1.0" encoding="UTF-8"?><collection xmlns="http://www.loc.gov/MARC21/slim"><record><leader>02440nam a2200577 cb4500</leader><controlfield tag="001">BV020827001</controlfield><controlfield tag="003">DE-604</controlfield><controlfield tag="005">20101222 </controlfield><controlfield tag="007">t</controlfield><controlfield tag="008">051011s2005 gw d||| |||| 00||| ger d</controlfield><datafield tag="020" ind1=" " ind2=" "><subfield code="a">3824607565</subfield><subfield code="9">3-8246-0756-5</subfield></datafield><datafield tag="035" ind1=" " ind2=" "><subfield code="a">(OCoLC)163431049</subfield></datafield><datafield tag="035" ind1=" " ind2=" "><subfield code="a">(DE-599)BVBBV020827001</subfield></datafield><datafield tag="040" ind1=" " ind2=" "><subfield code="a">DE-604</subfield><subfield code="b">ger</subfield><subfield code="e">rakwb</subfield></datafield><datafield tag="041" ind1="0" ind2=" "><subfield code="a">ger</subfield></datafield><datafield tag="044" ind1=" " ind2=" "><subfield code="a">gw</subfield><subfield code="c">DE</subfield></datafield><datafield tag="049" ind1=" " ind2=" "><subfield code="a">DE-M158</subfield><subfield code="a">DE-19</subfield><subfield code="a">DE-12</subfield><subfield code="a">DE-1102</subfield><subfield code="a">DE-11</subfield></datafield><datafield tag="082" ind1="0" ind2=" "><subfield code="a">310</subfield></datafield><datafield tag="084" ind1=" " ind2=" "><subfield code="a">QH 200</subfield><subfield code="0">(DE-625)141539:</subfield><subfield code="2">rvk</subfield></datafield><datafield tag="245" ind1="1" ind2="0"><subfield code="a">Handbuch zur Anonymisierung wirtschaftsstatistischer Mikrodaten</subfield><subfield code="c">Gerd Ronning ...</subfield></datafield><datafield tag="264" ind1=" " ind2="1"><subfield code="a">Wiesbaden</subfield><subfield code="b">Statistisches Bundesamt</subfield><subfield code="c">2005</subfield></datafield><datafield tag="300" ind1=" " ind2=" "><subfield code="a">612 S.</subfield><subfield code="b">graph. Darst.</subfield></datafield><datafield tag="336" ind1=" " ind2=" "><subfield code="b">txt</subfield><subfield code="2">rdacontent</subfield></datafield><datafield tag="337" ind1=" " ind2=" "><subfield code="b">n</subfield><subfield code="2">rdamedia</subfield></datafield><datafield tag="338" ind1=" " ind2=" "><subfield code="b">nc</subfield><subfield code="2">rdacarrier</subfield></datafield><datafield tag="490" ind1="1" ind2=" "><subfield code="a">Statistik und Wissenschaft</subfield><subfield code="v">4</subfield></datafield><datafield tag="500" ind1=" " ind2=" "><subfield code="a">Literaturverz.: S. 600- 608</subfield></datafield><datafield tag="650" ind1="0" ind2="7"><subfield code="a">Anonymisierung</subfield><subfield code="0">(DE-588)4139362-4</subfield><subfield code="2">gnd</subfield><subfield code="9">rswk-swf</subfield></datafield><datafield tag="650" ind1="0" ind2="7"><subfield code="a">Auswirkung</subfield><subfield code="0">(DE-588)4112646-4</subfield><subfield code="2">gnd</subfield><subfield code="9">rswk-swf</subfield></datafield><datafield tag="650" ind1="0" ind2="7"><subfield code="a">Datenveränderung</subfield><subfield code="0">(DE-588)4232201-7</subfield><subfield code="2">gnd</subfield><subfield code="9">rswk-swf</subfield></datafield><datafield tag="650" ind1="0" ind2="7"><subfield code="a">Wirtschaftsstatistik</subfield><subfield code="0">(DE-588)4066517-3</subfield><subfield code="2">gnd</subfield><subfield code="9">rswk-swf</subfield></datafield><datafield tag="650" ind1="0" ind2="7"><subfield code="a">Personenbezogene Daten</subfield><subfield code="0">(DE-588)4173908-5</subfield><subfield code="2">gnd</subfield><subfield code="9">rswk-swf</subfield></datafield><datafield tag="650" ind1="0" ind2="7"><subfield code="a">Datenschutz</subfield><subfield code="0">(DE-588)4011134-9</subfield><subfield code="2">gnd</subfield><subfield code="9">rswk-swf</subfield></datafield><datafield tag="651" ind1=" " ind2="7"><subfield code="a">Deutschland</subfield><subfield code="0">(DE-588)4011882-4</subfield><subfield code="2">gnd</subfield><subfield code="9">rswk-swf</subfield></datafield><datafield tag="689" ind1="0" ind2="0"><subfield code="a">Deutschland</subfield><subfield code="0">(DE-588)4011882-4</subfield><subfield code="D">g</subfield></datafield><datafield tag="689" ind1="0" ind2="1"><subfield code="a">Wirtschaftsstatistik</subfield><subfield code="0">(DE-588)4066517-3</subfield><subfield code="D">s</subfield></datafield><datafield tag="689" ind1="0" ind2="2"><subfield code="a">Personenbezogene Daten</subfield><subfield code="0">(DE-588)4173908-5</subfield><subfield code="D">s</subfield></datafield><datafield tag="689" ind1="0" ind2="3"><subfield code="a">Datenschutz</subfield><subfield code="0">(DE-588)4011134-9</subfield><subfield code="D">s</subfield></datafield><datafield tag="689" ind1="0" ind2=" "><subfield code="5">DE-604</subfield></datafield><datafield tag="689" ind1="1" ind2="0"><subfield code="a">Deutschland</subfield><subfield code="0">(DE-588)4011882-4</subfield><subfield code="D">g</subfield></datafield><datafield tag="689" ind1="1" ind2="1"><subfield code="a">Wirtschaftsstatistik</subfield><subfield code="0">(DE-588)4066517-3</subfield><subfield code="D">s</subfield></datafield><datafield tag="689" ind1="1" ind2="2"><subfield code="a">Personenbezogene Daten</subfield><subfield code="0">(DE-588)4173908-5</subfield><subfield code="D">s</subfield></datafield><datafield tag="689" ind1="1" ind2="3"><subfield code="a">Anonymisierung</subfield><subfield code="0">(DE-588)4139362-4</subfield><subfield code="D">s</subfield></datafield><datafield tag="689" ind1="1" ind2="4"><subfield code="a">Datenveränderung</subfield><subfield code="0">(DE-588)4232201-7</subfield><subfield code="D">s</subfield></datafield><datafield tag="689" ind1="1" ind2="5"><subfield code="a">Auswirkung</subfield><subfield code="0">(DE-588)4112646-4</subfield><subfield code="D">s</subfield></datafield><datafield tag="689" ind1="1" ind2=" "><subfield code="8">1\p</subfield><subfield code="5">DE-604</subfield></datafield><datafield tag="700" ind1="1" ind2=" "><subfield code="a">Ronning, Gerd</subfield><subfield code="d">1939-2019</subfield><subfield code="e">Sonstige</subfield><subfield code="0">(DE-588)138810745</subfield><subfield code="4">oth</subfield></datafield><datafield tag="830" ind1=" " ind2="0"><subfield code="a">Statistik und Wissenschaft</subfield><subfield code="v">4</subfield><subfield code="w">(DE-604)BV019357198</subfield><subfield code="9">4</subfield></datafield><datafield tag="856" ind1="4" ind2="2"><subfield code="m">HBZ Datenaustausch</subfield><subfield code="q">application/pdf</subfield><subfield code="u">http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=013832275&sequence=000002&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA</subfield><subfield code="3">Inhaltsverzeichnis</subfield></datafield><datafield tag="999" ind1=" " ind2=" "><subfield code="a">oai:aleph.bib-bvb.de:BVB01-013832275</subfield></datafield><datafield tag="883" ind1="1" ind2=" "><subfield code="8">1\p</subfield><subfield code="a">cgwrk</subfield><subfield code="d">20201028</subfield><subfield code="q">DE-101</subfield><subfield code="u">https://d-nb.info/provenance/plan#cgwrk</subfield></datafield></record></collection> |
geographic | Deutschland (DE-588)4011882-4 gnd |
geographic_facet | Deutschland |
id | DE-604.BV020827001 |
illustrated | Illustrated |
indexdate | 2024-07-09T20:20:08Z |
institution | BVB |
isbn | 3824607565 |
language | German |
oai_aleph_id | oai:aleph.bib-bvb.de:BVB01-013832275 |
oclc_num | 163431049 |
open_access_boolean | |
owner | DE-M158 DE-19 DE-BY-UBM DE-12 DE-1102 DE-11 |
owner_facet | DE-M158 DE-19 DE-BY-UBM DE-12 DE-1102 DE-11 |
physical | 612 S. graph. Darst. |
publishDate | 2005 |
publishDateSearch | 2005 |
publishDateSort | 2005 |
publisher | Statistisches Bundesamt |
record_format | marc |
series | Statistik und Wissenschaft |
series2 | Statistik und Wissenschaft |
spelling | Handbuch zur Anonymisierung wirtschaftsstatistischer Mikrodaten Gerd Ronning ... Wiesbaden Statistisches Bundesamt 2005 612 S. graph. Darst. txt rdacontent n rdamedia nc rdacarrier Statistik und Wissenschaft 4 Literaturverz.: S. 600- 608 Anonymisierung (DE-588)4139362-4 gnd rswk-swf Auswirkung (DE-588)4112646-4 gnd rswk-swf Datenveränderung (DE-588)4232201-7 gnd rswk-swf Wirtschaftsstatistik (DE-588)4066517-3 gnd rswk-swf Personenbezogene Daten (DE-588)4173908-5 gnd rswk-swf Datenschutz (DE-588)4011134-9 gnd rswk-swf Deutschland (DE-588)4011882-4 gnd rswk-swf Deutschland (DE-588)4011882-4 g Wirtschaftsstatistik (DE-588)4066517-3 s Personenbezogene Daten (DE-588)4173908-5 s Datenschutz (DE-588)4011134-9 s DE-604 Anonymisierung (DE-588)4139362-4 s Datenveränderung (DE-588)4232201-7 s Auswirkung (DE-588)4112646-4 s 1\p DE-604 Ronning, Gerd 1939-2019 Sonstige (DE-588)138810745 oth Statistik und Wissenschaft 4 (DE-604)BV019357198 4 HBZ Datenaustausch application/pdf http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=013832275&sequence=000002&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA Inhaltsverzeichnis 1\p cgwrk 20201028 DE-101 https://d-nb.info/provenance/plan#cgwrk |
spellingShingle | Handbuch zur Anonymisierung wirtschaftsstatistischer Mikrodaten Statistik und Wissenschaft Anonymisierung (DE-588)4139362-4 gnd Auswirkung (DE-588)4112646-4 gnd Datenveränderung (DE-588)4232201-7 gnd Wirtschaftsstatistik (DE-588)4066517-3 gnd Personenbezogene Daten (DE-588)4173908-5 gnd Datenschutz (DE-588)4011134-9 gnd |
subject_GND | (DE-588)4139362-4 (DE-588)4112646-4 (DE-588)4232201-7 (DE-588)4066517-3 (DE-588)4173908-5 (DE-588)4011134-9 (DE-588)4011882-4 |
title | Handbuch zur Anonymisierung wirtschaftsstatistischer Mikrodaten |
title_auth | Handbuch zur Anonymisierung wirtschaftsstatistischer Mikrodaten |
title_exact_search | Handbuch zur Anonymisierung wirtschaftsstatistischer Mikrodaten |
title_full | Handbuch zur Anonymisierung wirtschaftsstatistischer Mikrodaten Gerd Ronning ... |
title_fullStr | Handbuch zur Anonymisierung wirtschaftsstatistischer Mikrodaten Gerd Ronning ... |
title_full_unstemmed | Handbuch zur Anonymisierung wirtschaftsstatistischer Mikrodaten Gerd Ronning ... |
title_short | Handbuch zur Anonymisierung wirtschaftsstatistischer Mikrodaten |
title_sort | handbuch zur anonymisierung wirtschaftsstatistischer mikrodaten |
topic | Anonymisierung (DE-588)4139362-4 gnd Auswirkung (DE-588)4112646-4 gnd Datenveränderung (DE-588)4232201-7 gnd Wirtschaftsstatistik (DE-588)4066517-3 gnd Personenbezogene Daten (DE-588)4173908-5 gnd Datenschutz (DE-588)4011134-9 gnd |
topic_facet | Anonymisierung Auswirkung Datenveränderung Wirtschaftsstatistik Personenbezogene Daten Datenschutz Deutschland |
url | http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=013832275&sequence=000002&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA |
volume_link | (DE-604)BV019357198 |
work_keys_str_mv | AT ronninggerd handbuchzuranonymisierungwirtschaftsstatistischermikrodaten |