📊 Statistiek Cursus - Oefeningen - Hoofdstuk 4: Betrouwbaarheid & Grote Datasets

Oefeningen - Hoofdstuk 4: Betrouwbaarheid & Grote Datasets

Zelf proberen. Klik op antwoord om te zien.

ICT: Met rekenapp Zonder ICT

📊 Dataset-oefeningen

Dataset: Studentenprestaties (Exam Scores)

Dataset met examenscores van 395 studenten. Download van Kaggle, zet in rekenapp. Maak frequentietabel, histogram, bereken gemiddelde/mediaan/modus en standaardafwijking. Is de verdeling normaal?

Skills: Dataset organiseren, Grafische voorstelling kiezen, Centrummaten berekenen, Spreidingsmaten berekenen, Normale verdeling beoordelen

📊 Met rekenapp

→ Dataset downloaden (Kaggle) | → Rekenblad

Dataset: Studentenprestaties (Performance)

Dataset met prestaties van 1000+ studenten. Test: Is gemiddelde score gelijk aan 70? Controleer eerst of data normaal verdeeld is (histogram/qqplot). Voer hypothesetoets uit met α=0.05. Wat is je conclusie?

Skills: Normale verdeling beoordelen, Hypothesetoets op dataset, Conclusie trekken

📊 Met rekenapp

→ Dataset downloaden (Kaggle) | → Rekenblad

Dataset: Temperatuur & Ijsconsumptie

Dataset met relatie tussen temperatuur en ijsconsumptie. Download van Kaggle, zet in rekenapp. Maak spreidingsdiagram, bereken correlatiecoëfficiënt. Is correlatie sterk? Pas trendlijn toe en voorspel ijsconsumptie voor 25°C. Correlatie ≠ causaliteit?

Skills: Spreidingsdiagram tekenen, Correlatiecoëfficiënt berekenen, Trendlijn gebruiken, Correlatie interpreteren

📊 Met rekenapp

→ Dataset downloaden (Kaggle) | → Rekenblad

Dataset: Studentenprestaties (xAPI-Edu-Data)

Uitgebreide dataset met 480 studenten: attributen als leergedrag, aanwezigheid, interactie. Maak spreidingsdiagram van bijv. tijd spent ↔ eindcijfer. Bereken correlatiecoëfficiënt. Test causaliteit: meer studeren → beter cijfer?

Skills: Spreidingsdiagram tekenen, Correlatiecoëfficiënt berekenen, Causaliteit testen

📊 Met rekenapp

→ Dataset downloaden (Kaggle) | → Rekenblad

💡 Tip: Voor het echte examen zul je ook data ingeladen krijgen. Dit prutsen met data-import is onderdeel van het examen!

CI voor proportie

📊 Met rekenapp

→ Rekenapp

Opgave 1: Steekproef: n=400, p̂=0.55. Bepaal 95% CI voor populatieproportie.
Klik voor antwoord →
CI ≈ [0.50, 0.60] (marge ≈ 0.05)
Opgave 2: n=100, p̂=0.30, 90% CI voor p
Klik voor antwoord →
CI ≈ [0.23, 0.37]
Opgave 3: n=1000, p̂=0.45, 95% CI
Klik voor antwoord →
CI ≈ [0.42, 0.48] (smaller omdat n groter)
Opgave 4: n=50, p̂=0.6, 99% CI
Klik voor antwoord →
CI ≈ [0.46, 0.74] (breder door hogere betrouwbaarheid)

CI voor gemiddelde

📊 Met rekenapp

→ Rekenapp

Opgave 5: Steekproef: n=30, x̄=105, s=15. Bepaal 95% CI voor μ
Klik voor antwoord →
CI ≈ [99.6, 110.4]
Opgave 6: n=100, x̄=50, s=8, 90% CI
Klik voor antwoord →
CI ≈ [48.7, 51.3]
Opgave 7: n=64, x̄=200, s=20, 95% CI
Klik voor antwoord →
CI ≈ [195.1, 204.9]
Opgave 8: n=25, x̄=80, s=10, 99% CI
Klik voor antwoord →
CI ≈ [72.9, 87.1]

CI interpreteren

Zonder ICT
Opgave 9: Een 95% CI voor gemiddelde gewicht is [78, 82] kg. Klopt: "95% van alle mensen wiegen tussen 78-82 kg"?
Klik voor antwoord →
Nee! 95% CI betekent: "Als we steekproef herhalen, 95% van intervallen bevat ware μ"
Opgave 10: Wat betekent "90% betrouwbaarheidsinterval [0.40, 0.50] voor proportie"?
Klik voor antwoord →
Van 100 steekproeven verwacht je dat 90 dezelfde soort interval ware p bevat
Opgave 11: Waarom is een 99% CI breder dan 95% CI (bij zelfde n)?
Klik voor antwoord →
Meer betrouwbaarheid kost breedte: zekerheid trade-off
Opgave 12: Als CI = [100, 110]: kan je zeggen "de ware parameter is ergens tussen 100-110"?
Klik voor antwoord →
Ja, dat is correcte interpretatie