Oefeningen - Hoofdstuk 4: Betrouwbaarheid & Grote Datasets
Zelf proberen. Klik op antwoord om te zien.
ICT: Met rekenapp Zonder ICT
📊 Dataset-oefeningen
Dataset: Studentenprestaties (Exam Scores)
Dataset met examenscores van 395 studenten. Download van Kaggle, zet in rekenapp. Maak frequentietabel, histogram, bereken gemiddelde/mediaan/modus en standaardafwijking. Is de verdeling normaal?
Skills: Dataset organiseren, Grafische voorstelling kiezen, Centrummaten berekenen, Spreidingsmaten berekenen, Normale verdeling beoordelen
📊 Met rekenapp
→ Dataset downloaden (Kaggle) | → Rekenblad
Dataset: Studentenprestaties (Performance)
Dataset met prestaties van 1000+ studenten. Test: Is gemiddelde score gelijk aan 70? Controleer eerst of data normaal verdeeld is (histogram/qqplot). Voer hypothesetoets uit met α=0.05. Wat is je conclusie?
Skills: Normale verdeling beoordelen, Hypothesetoets op dataset, Conclusie trekken
📊 Met rekenapp
→ Dataset downloaden (Kaggle) | → Rekenblad
Dataset: Temperatuur & Ijsconsumptie
Dataset met relatie tussen temperatuur en ijsconsumptie. Download van Kaggle, zet in rekenapp. Maak spreidingsdiagram, bereken correlatiecoëfficiënt. Is correlatie sterk? Pas trendlijn toe en voorspel ijsconsumptie voor 25°C. Correlatie ≠causaliteit?
Skills: Spreidingsdiagram tekenen, Correlatiecoëfficiënt berekenen, Trendlijn gebruiken, Correlatie interpreteren
📊 Met rekenapp
→ Dataset downloaden (Kaggle) | → Rekenblad
Dataset: Studentenprestaties (xAPI-Edu-Data)
Uitgebreide dataset met 480 studenten: attributen als leergedrag, aanwezigheid, interactie. Maak spreidingsdiagram van bijv. tijd spent ↔ eindcijfer. Bereken correlatiecoëfficiënt. Test causaliteit: meer studeren → beter cijfer?
Skills: Spreidingsdiagram tekenen, Correlatiecoëfficiënt berekenen, Causaliteit testen
📊 Met rekenapp
→ Dataset downloaden (Kaggle) | → Rekenblad
💡 Tip: Voor het echte examen zul je ook data ingeladen krijgen. Dit prutsen met data-import is onderdeel van het examen!
CI voor proportie
📊 Met rekenapp
→ Rekenapp
Opgave 1: Steekproef: n=400, p̂=0.55. Bepaal 95% CI voor populatieproportie.
Klik voor antwoord →
CI ≈ [0.50, 0.60] (marge ≈ 0.05)
Opgave 2: n=100, p̂=0.30, 90% CI voor p
Klik voor antwoord →
CI ≈ [0.23, 0.37]
Opgave 3: n=1000, p̂=0.45, 95% CI
Klik voor antwoord →
CI ≈ [0.42, 0.48] (smaller omdat n groter)
Opgave 4: n=50, p̂=0.6, 99% CI
Klik voor antwoord →
CI ≈ [0.46, 0.74] (breder door hogere betrouwbaarheid)
CI voor gemiddelde
📊 Met rekenapp
→ Rekenapp
Opgave 5: Steekproef: n=30, x̄=105, s=15. Bepaal 95% CI voor μ
Klik voor antwoord →
CI ≈ [99.6, 110.4]
Opgave 6: n=100, x̄=50, s=8, 90% CI
Klik voor antwoord →
CI ≈ [48.7, 51.3]
Opgave 7: n=64, x̄=200, s=20, 95% CI
Klik voor antwoord →
CI ≈ [195.1, 204.9]
Opgave 8: n=25, x̄=80, s=10, 99% CI
Klik voor antwoord →
CI ≈ [72.9, 87.1]
CI interpreteren
Zonder ICT
Opgave 9: Een 95% CI voor gemiddelde gewicht is [78, 82] kg. Klopt: "95% van alle mensen wiegen tussen 78-82 kg"?
Klik voor antwoord →
Nee! 95% CI betekent: "Als we steekproef herhalen, 95% van intervallen bevat ware μ"
Opgave 10: Wat betekent "90% betrouwbaarheidsinterval [0.40, 0.50] voor proportie"?
Klik voor antwoord →
Van 100 steekproeven verwacht je dat 90 dezelfde soort interval ware p bevat
Opgave 11: Waarom is een 99% CI breder dan 95% CI (bij zelfde n)?
Klik voor antwoord →
Meer betrouwbaarheid kost breedte: zekerheid trade-off
Opgave 12: Als CI = [100, 110]: kan je zeggen "de ware parameter is ergens tussen 100-110"?
Klik voor antwoord →
Ja, dat is correcte interpretatie