Transcript
Verzamelingenleer
N natuurlijke getallen
Z gehele getallen
Q rationale getallen
R gehele getallen
Ø lege verzameling
U universele verzameling
{a, b, ...} verzameling van elementen, volgorde niet belangrijk
(a,b,..) verzameling van elementen, volgorde belangrijk
0,1=x?Ro 1 dan pX-x?k?sx?1k²
?als k'>1 dan pX-x²?k'?sx²?1k'
Transformaties van variabelen
Z-transformatie tot Z-scores: Z(xi)=xi-xsx
?standaardnormale verdeling: zx=0 en szx²=1
Bij lineaire transformatie blijft de z-score hetzelfde bij a>0 en omgekeerd/negatief bij a<0
Transformaties en de frequentiefunctie
De frequentie volgens de getransformeerde functie Y=f(X) is de som van de frequenties van de x-waarden die in de oorspronkelijke functie op die y-waarde werden afgebeeld
freqY(y)=freqx(f-1(y))=xf(x)=yfreqx(x)
Transformaties en centrale tendensmaten
Bij een lineaire transformatie (f(x)=ax+b) bekom je het gemiddelde door op het gemiddelde van de oorspronkelijke gegevens de transformatie toe te passen
f(x)=f(x)=ax+b
Transformaties en spreidingsmaten
Bij een lineaire transformatie
sY2=a²sx² en dus ook sY=asx
Beschrijvende statistiek met 2 variabelen
Frequentiefuncties
Met variabele X en Y: freqX,Y(xj,yj) en pX,Y(xj',yj') met j van 1 tot m en j’ van 1 tot m’
Marginale freqentie- en proportiefuncties: freqx en freqy en px en py (rij en kolomtotalen)
Rijconditionele proporties pY|X=xj(yj')=freqX,Y(xj,yj')freqX(xj)=pX,Y(xj,yj')pX(xj)
Kolomconditionele proporties pX|Y=yj'(xj')=freqX,Y(xj,yj')freqY(yj')=pX,Y(xj,yj')pY(yj')
Samenvattende maten
Centrale tendensmaten
y|X=xj=1freqx(xj)j'=1m'freqX,Y(xj,yj')yj'=j'=1m'pY|X=xj(yj')yj'
X|Y=yj'=1freqY(yj')j=1mfreqX,Y(xj,yj')xj=j=1mpX|Y=yj'(xj)xj
Spreidingsmaten
conditionele variantie sy|X=xj2=1freqxxjj'=1m'freqX,Yxj,yj'yj'²-(y|X=xj)²
=j'=1m'pY|X=xj(yj')yj'²-(y|X=xj)²
?sx|Y=yj'2
Samenhangs- of associatiematen
KWALITATIEVE VARIABELEN
proportie overeenstemming =aantal overeenkomstige antwoordenalle antwoorden
KWANTITATIEVE VARIABELEN
B1: associatiematen
covariantie (sxy) = 1ni=1n(xi-x)(yi-y) bij inductieve stat: delen dr (n-1)
=1nixiyi-xy
=1nj=1mj'=1m'freqX,Y(xj,yj')(xj-x)(yj'-y)=1nj'=1m'j=1mfreqX,Y(xj,yj') xjyj'-xy
=j=1mj'=1m'pX,Y(xj,yj')(xj-x)(yj'-y)=j'=1m'j=1mpX,Y(xj,yj') xjyj'-xy
Eigenschappen
sxy = syx
s(ax+b) y = a sxy
-sxsy?sxy?sxsy
?meeteenheid-afhankelijk ? productmomentcorrelatie: (rxy)= szxszy -1?rxy?+1 (en rxx=1)
rxy=1niZX(xi)?ZY(yi)=sxysxsy
rxy = ryx
r(ax+b) y=rxy met a>0-rxy met a<0
rxy=1??i: ZX(xi)=ZY(yi)
rxy=-1??i: ZX(xi)=-ZY(yi)
B2 Optimale voorspelling
B.2.1. Algemene optimale voorspelling
Yiest =f(xi)
sy.x2=1ni=1n(yiest-yi)² gewadrateerde standaardfout van estimatie: maat vr voorspellingsfouten
B.2.2. Optimale lineaire voorspelling
yiest=b0+b1xi met b0=y-b1x en b1=rxysysx ?xiest
? yiest=y+rxysysx(xi-x) ?yiest-ysy=rxyxi-xsx ?ZY(yiest)=rxyZX(xi)
yiest-yi'estsy=rxyxi-xi'sx ?ZY(yiest)-ZY(yi'est)=rxyZX(xi)-ZX(xi')
sy²=sy.x²+sverkl² ?sverkl²sy²=rxy² (kwaliteit van de regressie-voorspelling)
Somvariabelen
x+y=x+y
sx+y2=sx2+sy2+2sxy
s(x+y) z=sxz+syz
a0+kakxk=a0+kak xk
sa0+k(akxk)2=kak²sxk²+2k,k'k
|