Agrar- und Ernährungspolitik III Vorlesung 11. März 2009 Statistik und Modellierung auf Grundlage...

33
Agrar- und Ernährungspolitik III Vorlesung 11. März 2009 Statistik und Modellierung auf Grundlage einzelbetrieblicher Daten Martin Kniepert

Transcript of Agrar- und Ernährungspolitik III Vorlesung 11. März 2009 Statistik und Modellierung auf Grundlage...

Page 1: Agrar- und Ernährungspolitik III Vorlesung 11. März 2009 Statistik und Modellierung auf Grundlage einzelbetrieblicher Daten Martin Kniepert.

Agrar- und Ernährungspolitik III

Vorlesung 11. März 2009

Statistik und Modellierung auf Grundlage einzelbetrieblicher Daten

Martin Kniepert

Page 2: Agrar- und Ernährungspolitik III Vorlesung 11. März 2009 Statistik und Modellierung auf Grundlage einzelbetrieblicher Daten Martin Kniepert.

Übersicht

Auswahl einzelbetrieblicher DatenBuchhaltungsdaten

AuswahlrahmenStichprobenbestimmung (Streuungsplan)KonfidenzintervalleHochrechnungen

Page 3: Agrar- und Ernährungspolitik III Vorlesung 11. März 2009 Statistik und Modellierung auf Grundlage einzelbetrieblicher Daten Martin Kniepert.

Zur Berechnung von Einkommen in der Agrarwirtschaft

Marktorientierte Ansätze insbesondere die LGR (=> spätere Vorlesung)

Unmittelbar betriebsorientierte Ansätze – Auswertung von Buchhaltungsergebnissen landwirtschaftlicher Betriebe

Problem: Die Betriebe können nicht insgesamt erhoben werden.Lösung: Stichprobenerhebung aus der Grundgesamtheit

Page 5: Agrar- und Ernährungspolitik III Vorlesung 11. März 2009 Statistik und Modellierung auf Grundlage einzelbetrieblicher Daten Martin Kniepert.

Exkurs: Urlaub auf dem Bauernhof

Die Betriebe in ihrer Mischstruktur abzubilden kommt dabei auch dem agrarpolitischen Verständnis entgegen, die Multifunktionalität der Agrarproduktion im Auge zu behalten. Möglichkeiten zur Kombination von touristischem Angebot mit Landwirtschaft (Urlaub auf dem Bauernhof; Direktvermarktung die NitNils)

Land-wirtschaft

Tourismus

Page 6: Agrar- und Ernährungspolitik III Vorlesung 11. März 2009 Statistik und Modellierung auf Grundlage einzelbetrieblicher Daten Martin Kniepert.

Agrarregister

Registrierung aller landwirtschaftlichen Betriebe mit Sitz in ÖsterreichStammdaten

Betriebsnummer, Adresse, Name Bewirtschafterin

Erhebungsspezifische DatenEckdaten FlächeEckdaten Nutztierbestand…Standarddeckungsbeitrag (SDB)

http://www.statistik.gv.at/web_de/statistiken/land_und_forstwirtschaft/agrarregister/index.html

Page 7: Agrar- und Ernährungspolitik III Vorlesung 11. März 2009 Statistik und Modellierung auf Grundlage einzelbetrieblicher Daten Martin Kniepert.

StrukturerhebungenBetriebliche Erhebungen

Die Agrarstrukturerhebung (AS, als Vollerhebung: 1995, 1999, 2010, als Stichprobe 2003, 2005, 2007, 2013, 2016; für AT)Anbau auf dem Ackerland (jährlich; dient auch als Grundlage für die Agrarstrukturerhebung)WeingartenerhebungEtc.

http://www.statistik.gv.at/web_de/statistiken/land_und_forstwirtschaft/agrarstruktur_flaechen_ertraege/index.html

Rechtliche Grundlagen sind VoraussetzungenIn der Umsetzung enge Verzahnung verschiedener Verwaltungsdaten (insbesondere Mehrfachantrag der AMA) und sonstiger Erhebungen

Anbau auf dem AckerlandAllgemeine Viehzählung, die ihrerseits wieder verschiedene Datenbestände integriert

Page 8: Agrar- und Ernährungspolitik III Vorlesung 11. März 2009 Statistik und Modellierung auf Grundlage einzelbetrieblicher Daten Martin Kniepert.

Strukturerhebung (2)

Erfassungsuntergrenzen unterschiedlich nach Jahren, Betriebsformen etc.

Bspw. AS 1995: 1 ha Gesamtfläche; Bspw. AS 1999: 1 ha landwirtschaftliche genutzte Flächeetc.

Veränderte ErhebungsmethodenViehzählung über die Gemeinden => Rinderdatenbank (seit…Geflügelzählung über Gemeinden => QGVetc.

Jeweils Vergleichbarkeit von Daten überprüfen!

Page 9: Agrar- und Ernährungspolitik III Vorlesung 11. März 2009 Statistik und Modellierung auf Grundlage einzelbetrieblicher Daten Martin Kniepert.

Exkurs: Datenerhebung

Nicht aus wissenschaftlichem InteresseBspw.

Veränderte ErhebungsmethodenViehzählung über die Gemeinden => Rinderdatenbank (seit…Geflügelzählung über Gemeinden => (Östereichische Qualitätsgeflügelvereinigung (QGV)etc.

Jeweils Vergleichbarkeit von Daten überprüfen!

Page 10: Agrar- und Ernährungspolitik III Vorlesung 11. März 2009 Statistik und Modellierung auf Grundlage einzelbetrieblicher Daten Martin Kniepert.

Das INLB (1)

Das Informationsnetz Landwirtschaftlicher Buchführung (INLB; engl.: FADN, frz.: RICA)Basierend auf EU-Verordnungen

http://europa.eu.int/comm/agriculture/rica/index_de.cfmWeiter zu Rechtsgrundlagen...

INLB: „ ... die einzige Quelle mikroökonomischer Daten (..), die harmonisiert sind, d. h. die Buchhaltungsgrundsätze sind in allen Ländern gleich.“ [Anspruch]RI/CC 882 Rev.7.0

Page 11: Agrar- und Ernährungspolitik III Vorlesung 11. März 2009 Statistik und Modellierung auf Grundlage einzelbetrieblicher Daten Martin Kniepert.

Das INLB (2)

Für das INLB wird eine Stichprobe aus Gesamtzahl der lw. Betriebe gezogen.Die Stichprobe bezieht sich auf Betriebe in einem bestimmten AuswahlrahmenDie Auswahl der Betriebe erfolgt nicht nach dem Zufallsprinzip, sondern gezielt nach ausgewählten Kriterien.

[Berücksichtigt werden für Österreich übrigens bestimmte Aspekte, die für die EU insgesamt weniger wichtig sind; streng genommen ist das INLB eine Sonderauswertung der österreichischen Ergebnisse der lw. Buchführung.]

Page 12: Agrar- und Ernährungspolitik III Vorlesung 11. März 2009 Statistik und Modellierung auf Grundlage einzelbetrieblicher Daten Martin Kniepert.

Der Auswahlrahmen in Österreich (1)

6.000 € > StDB > 120.000 €Betriebe > 200 ha Wald bleiben ausgeschlossenBetriebe mit > 25% Gartenbauanteil bleiben ausgeschlossen

Auswahl-rahmen

Bäuerlich Betriebe

insg.

% BäuerlicheBetriebe

Betriebe insgesamt

Anzahl 112.435 207.487 54 217.508

Fläche (ha) 2.063.800 2.431.857 85 2.580.905

... ... ... ... ...

GVE 414.600 450.808 92 471.674

GSDB 2.566.942 3.101.902 83 3.518.322

=> Konzentrationsprinzip (vgl. Kromrey 1994:203)

Quelle: Grüner Bericht 2004

Page 13: Agrar- und Ernährungspolitik III Vorlesung 11. März 2009 Statistik und Modellierung auf Grundlage einzelbetrieblicher Daten Martin Kniepert.

Der Auswahlrahmen in Österreich (2)

Gartenbau, große Forstbetriebe

Gro

ßbet

riebe

Klei

nstb

etrie

be Auswahlrahmen

Buchführungsergebnisse

Page 14: Agrar- und Ernährungspolitik III Vorlesung 11. März 2009 Statistik und Modellierung auf Grundlage einzelbetrieblicher Daten Martin Kniepert.

Reine Zufallsstichprobe vs. „repräsentative“ Stichprobe

Mindestens 2.200 Betriebe entspr. 1,96 % der Gesamtzahl des Auswahlrahmens (217.508)Repräsentationsrelevante MerkmaleStichprobe als verkleinertes Abbild einer GrundgesamtheitGrad der Homogenität der Grundgesamtheit wichtig für die „Stichhaltigkeit“ der Stichprobe.

Stichprobenumfang n von Grundgesamtheit NHochrechnung des Stichprobenergebnisses y auf die Grundgesamtheit: Y = y/n * NJe homogener die Grundgesamtheit ist, desto kleiner kann die Stichprobe sein, im theoretischen Grenzfall ist n = 1

Page 15: Agrar- und Ernährungspolitik III Vorlesung 11. März 2009 Statistik und Modellierung auf Grundlage einzelbetrieblicher Daten Martin Kniepert.

Inhomogenität der Grundgesamtheit

Gerade die Unterschiede in einer Grundgesamtheit können Gegenstand der Untersuchung sein (Strukturentwicklung)Gut konstruierte Streuungspläne erlauben die Verringerung der Erhebungsbedarfs => Repräsentativität.

KostenersparnisGrößere Sorgfalt bei Einheiten der Stichprobe möglichKleinere Stichproben möglicherweise vorteilhafter gegenüber großen!

Page 16: Agrar- und Ernährungspolitik III Vorlesung 11. März 2009 Statistik und Modellierung auf Grundlage einzelbetrieblicher Daten Martin Kniepert.

Geschichtete Stichproben (1)

Vorteile: Größere Genauigkeit bei geringerem Aufwand; RepräsentativitätNachteil: Mit den Schichtungskriterien werden gleichzeitig die Auswertungsmöglichkeiten festgelegt: Die Repräsentativität gilt in Bezug auf SchichtungskriterienAuswertungen mit Blick bspw. auf biologische Landwirtschaft/konventionelle Landwirtschaft können sich nicht auf die gleiche Repräsentativität stützen

Page 17: Agrar- und Ernährungspolitik III Vorlesung 11. März 2009 Statistik und Modellierung auf Grundlage einzelbetrieblicher Daten Martin Kniepert.

Geschichtete Stichproben (2)

Trotzdem: Die erhobenen Daten können entsprechend anderer Kriterien neu gewichtet hochgerechnet werden. Vorraussetzung: Ausreichende Anzahl von Betrieben für einen statistisch signifikanten Stichprobenumfang.Handicap: Die Betriebe wurden unter anderen Gesichtspunkten ausgewählt, das Zufallsprinzip ist insofern nicht eingehalten.

Page 18: Agrar- und Ernährungspolitik III Vorlesung 11. März 2009 Statistik und Modellierung auf Grundlage einzelbetrieblicher Daten Martin Kniepert.

Streuungsplan der lw. Buchführung

70 „Schichten“ (vgl. Tab. A2, LBG 2001)Disproportional geschichtet (Hochrechnung mit Gewichten für einzelnen Schichten)Jede Schicht in der Stichprobe wird als repräsentativ für die entsprechende Schicht in der Grundgesamtheit zusammengestelltDie einzelnen Schichten (S) werden gewichtet, um auch für den Auswahlrahmen insgesamt repräsentativ zu seinBezugsgröße: Familienarbeitskräfte, ha RLN, Größen die in der Stichprobe und in der Grundgesamtheit vorliegen.

Page 19: Agrar- und Ernährungspolitik III Vorlesung 11. März 2009 Statistik und Modellierung auf Grundlage einzelbetrieblicher Daten Martin Kniepert.

Kriterien für den Streuungsplan (1)4 Größenklassen (6-12 tsd. ... 90-120 tsd. €)

[noch bis 2002: 8 Größenklassen]

Bis 2002: Gebiet explizit im Streuungsplanalpine Lagen mittlere Höhenlagen Flach- und Hügelland zusätzlich und genauer für Österreich: Erschwerniszonen, Höhe, Hangneigung)

Betriebstypen entsprechend Strukturerhebung (siehe Folgeblatt)

Page 20: Agrar- und Ernährungspolitik III Vorlesung 11. März 2009 Statistik und Modellierung auf Grundlage einzelbetrieblicher Daten Martin Kniepert.

Kriterien für den Streuungsplan (2)

Betriebstypen im EinzelnenBetriebe mit hohem Forstanteil (>50%)Betriebe mit 25 bis 50% ForstanteilFutterbaubetriebe (Milchkühe, sonst. Rinder, Schafe, Ziegen, Pferde u.a.)Landwirtschaftliche MischbetriebeMarktfruchtbetriebe (Getreide, Zuckerrüben, Erdäpfel, Ölfrüchte, Alternativen, Tabak, sonst. marktfähige Produkte)Dauerkulturen (Obst- und Weinbau)Veredelung (Schweine, Geflügel)

Page 21: Agrar- und Ernährungspolitik III Vorlesung 11. März 2009 Statistik und Modellierung auf Grundlage einzelbetrieblicher Daten Martin Kniepert.

Flächen einer Normalverteilung N(μ,σ)y

-z

z

0,4

0,3

0,2

0,1

μ-

σμ-2σ

μ68,27%95,45%99,73%99,99%

μ-3σ

μ-4σ

μ+4σ

μ+3σ

μ+2σ

μ+σ

Page 22: Agrar- und Ernährungspolitik III Vorlesung 11. März 2009 Statistik und Modellierung auf Grundlage einzelbetrieblicher Daten Martin Kniepert.

Standardnormalverteilung N(0,1)

Jede beliebige Normalverteilung N(μ,σ) kann durch Standardisierung in eine einheitliche Standardnormalverteilung N(0,1) transformiert (d.h. mit z multipliziert) werden.

Für N(0,1) sind Flächenanteile (also Wahrscheinlich-keiten) „austabelliert“.

...., fürX

zbzwX

zX

X

Page 23: Agrar- und Ernährungspolitik III Vorlesung 11. März 2009 Statistik und Modellierung auf Grundlage einzelbetrieblicher Daten Martin Kniepert.

Flächen einer Standard-Normalverteilung N(0,1)

y

-z

z

0,4

0,3

0,2

0,1

-1-2-3-4 0 1 2 3 468,27%95,45%99,73%99,99%

Page 24: Agrar- und Ernährungspolitik III Vorlesung 11. März 2009 Statistik und Modellierung auf Grundlage einzelbetrieblicher Daten Martin Kniepert.

Konfidenzintervall

undtxxdfkrit )%,5,2(%)95(

undzxxkrit %)5,2(%)95(

xkrit zx %)5,0(%)99(

Für n > 30 kann diese Formel genutzt werden:

xdfkrit tx )%,5,0(%)99(

Das Konfidenzintervall (Δkrit) für Mittelwerte (μ) berechnet sich folgendermaßen:

Page 25: Agrar- und Ernährungspolitik III Vorlesung 11. März 2009 Statistik und Modellierung auf Grundlage einzelbetrieblicher Daten Martin Kniepert.

T-Verteilungen (df =1, 3, 5, 10)

Vgl. http://www.uni-kiel.de/medinfo/biometrie/folien/ss08_2003/sld012.htm

Page 26: Agrar- und Ernährungspolitik III Vorlesung 11. März 2009 Statistik und Modellierung auf Grundlage einzelbetrieblicher Daten Martin Kniepert.

t-Verteilung

df p 0,900 p 0,975 p 0,990 p 0,995

1   3,078 12,706 31,821 63,656

2 1,886 4,303 6,965 9,925

3 1,638 3,182 4,541 5,841

4 1,533 2,776 3,747 4,604

... ... ... ... ...

10 1,372 2,228 2,764 3,169

... ... ... ... ...

30 1,310 2,042 2,457 2,750

1000 1,282 1,962 2,330 2,581

Page 27: Agrar- und Ernährungspolitik III Vorlesung 11. März 2009 Statistik und Modellierung auf Grundlage einzelbetrieblicher Daten Martin Kniepert.

Zur Hypothesenbildung

Nullhypothese H0: Ein Zusammenhang zwischen zwei untersuchten Größen

besteht nicht!

Alternativhypothese H1: In der Regel die Forschungshypothese Ein Zusammenhang zwischen zwei untersuchten größen wird

unterstell bzw. soll nachgewiesen werden.

Page 28: Agrar- und Ernährungspolitik III Vorlesung 11. März 2009 Statistik und Modellierung auf Grundlage einzelbetrieblicher Daten Martin Kniepert.

Zur Hypothesenbildung (1)

Nullhypothese H0: Ein Zusammenhang zwischen zwei untersuchten Größen

besteht nicht! (bspw. Steuer auf Inputverbrauch) Ein Grenzwert wird nicht überschritten, höchstens erreicht

Alternativhypothese H1: In der Regel die Forschungshypothese Ein Zusammenhang zwischen zwei untersuchten Größen wird

unterstellt, soll nachgewiesen werden. Ein Grenzwert wird überschritten

Page 29: Agrar- und Ernährungspolitik III Vorlesung 11. März 2009 Statistik und Modellierung auf Grundlage einzelbetrieblicher Daten Martin Kniepert.

Zur Hypothesenbildung (2) Nullhypothese H0 und Alternativhypothese H1 schließen

sich gegenseitig aus. Bspw. H0: Pestizidbelastung <= 3 g je / kg H1 : Pestizidbelastung > 3 g je / kg

Eine dritte Möglichkeit neben diesen Hypothesen bleiben nicht.

Im Beispiel (3 g je / kg ) wird eine Annahmegrenze (cA)

präzisiert. Der kritische Wert (c) beläuft sich auf 3 g bei einem

Stichprobenumfang von 1 kg.

Page 30: Agrar- und Ernährungspolitik III Vorlesung 11. März 2009 Statistik und Modellierung auf Grundlage einzelbetrieblicher Daten Martin Kniepert.

Begriffe Im Beispiel (3 g je / kg ) wird eine Annahmegrenze (cA)

präzisiert. Der kritische Wert (c) beläuft sich auf 3 g bei einem

Stichprobenumfang von 1 kg. Signifikanzniveau α0:

Page 31: Agrar- und Ernährungspolitik III Vorlesung 11. März 2009 Statistik und Modellierung auf Grundlage einzelbetrieblicher Daten Martin Kniepert.

Bestätigung? Fehler 1. und 2. Art Wenn eine Hypothese bestätigt werden kann, gilt die

andere automatisch als verworfen. Eine dritte Möglichkeit neben diesen Hypothesen

bleiben nicht. Fehler 1. Art: H0 wird verworfen, obwohl H0 richtig ist. Fehler 2. Art: H0 wird angenommen, obwohl H0 falsch

ist. In beiden Fällen erweist sich die Stichprobe als

gewissermaßen nicht stichhaltig.

Page 32: Agrar- und Ernährungspolitik III Vorlesung 11. März 2009 Statistik und Modellierung auf Grundlage einzelbetrieblicher Daten Martin Kniepert.

Beispiel Pestizid Nullhypothese H0 und Alternativhypothese H1 schließen

sich gegenseitig aus. Bspw. H0: Pestizidbelastung <= 3 g je / kg H1 : Pestizidbelastung > 3 g je / kg

Eine dritte Möglichkeit neben diesen Hypothesen bleiben nicht.

Page 33: Agrar- und Ernährungspolitik III Vorlesung 11. März 2009 Statistik und Modellierung auf Grundlage einzelbetrieblicher Daten Martin Kniepert.

Lese- und Lernempfehlungen

Zu Signifikanztests, Konfidenzintervall etc.Sachs, Lothar (1999), Angewandte Statistik, Neunte Überarbeitete Auflage, Berlin, Heidelberg [Lehrbuchsammlung der BOKU 32.60. 1 9A, insb. S. 97ff)Bortz, J., Döring, N. (1995), Forschungsmethoden und Evaluation, 2. Auflage, Berlin et al. ([Lehrbuchsammlung der BOKU 20.60 1 2A, insbes. Seite 368 -399]Erben, Wilhelm (1998), Statistik mit Excel 5 oder 7, (Buch mit Diskette), [Lehrbuchsammlung der BOKU 32.60 5]

Zur den BuchaltungsdatenLBG-Wirtschaftstreuhand, Buchführungsergebnisse aus der österreichischen Landwirtschaft (jährlich), WienBMLFUW (Hg), Grüner Bericht (jährlich, Wien) (www.gruenerbericht.at)

Diverse Internet-Angebote unter Stichworten wie „Konfidenzintervall“, „Standardfehler“ etc. mit Java-Applets zur Manipulation von Parametern etc.