Tip:
Highlight text to annotate it
X
Do te ishte mire te prezantonim diq nga terminologjia elementare
qe shpesh perdoret ne IA per te ndare llojet e ndryshme te problemeve.
Fjala e pare qe do t'ua mesoj eshte komplet dhe pjeserisht e observueshme.
Nje ambient quhet komplet i observueshem kur agjenti mund te ndjej
ne cdo pike dhe ne cdo kohe ka informata t'mjaftueshme per te marre vendimin optimal.
Pra, p.sh. ne shume lloje te lojrave me letra,
kur te gjitha letrat jane te tavoline, pozicionimi momental i te gjitha letrave
eshte informate e mjaftueshme per te bere zgjidhjen optimale.
kjo eshte e kunderta me disa ambiente tjera kur ju nevoitet te memorizoni
ne pozite qe agjenti te marre vendimin me te mire te mundshem.
P.sh. ne lojen e pokerit, letrat nuk jane te hapura ne tavoline,
dhe memorizimi i veprimeve te me hereshme do ju ndihmojne qe te merrni vendim me te favorshem.
Per te kuptuar plotesisht dallimin, merreni parasyshe bashkeveprimin e nje agjenti
me ambientin permes sensoreve dhe aktuatoreve,
dhe ky bashkeveprim ze vend ne shume cikle,
shpesh quhet cilkli percepitm-veprim.
Per shume ambiente, eshte leht te supozojme
se ambienti ka nje lloj gjendje te brendshme.
P.sh. Ne lojerat kur letrat nuk jane te hapura ne tavoline,
gjendja mund te lidhjet me letrat ne doren tuaj.
Ambienti eshte komplet i observueshem nese sensoret mund te shohin ne cdo kohe
gjendjen totale te ambientit.
Eshte pjeserisht i observueshem nese sensoret mund te shohin vetem nje fraksion (pjese) te gjendjes,
dhe duke memorizuar matjet e mehereshme na jep informacion adicional te gjendjes
qe nuk eshte i gatshem te observohet per momentin.
Pra, cdo loje, p.sh. kur veprimet e me hereshme na japin informacion ne lidhje me
cka mund te mbaje ne dore personi, keto loje jane pjeserisht te observueshme,
dhe kerkojne tretman tjeter.
Shume shpesh agjentet qe merren me ambiente pjeserisht te observueshme
kane nevoje per memorie te brendshme per te kuptuar
gjendjen e ambientit, dhe do te bisedojme me gjeresisht
kur te flasim per modelet e fshehura te Markovit dhe se si kjo strukture
ka aq memorie te brendshme.
Terminologjia e dyte per ambientet ka te beje me ate nese ambienti
eshte i determinueshem apo i paparapare.
Ambienti i determinueshem eshte ai ambient ku veprimet e agjentit tuaj
ne menyre unike determinojne rezultatet
Pra, p.sh. ne lojen e shahut, nuk ka rastesi kur ju beni nje levizje.
Efekti i levizjes eshte komplet i determinueshem apo i parapare
dhe kudo qe une do ta levize figuren e njejt, rezultati eshte i njejt.
Ate e quajme te determinueshem
Lojerat me zare, p.sh. si "backgammon" jane te paparapara.
Deri sa ju prap mund te levizni figurat ne menyre te determinueshme,
rezultati i nje levizje gjithashtu involvon hudhjen e zarit,
dhe nuk mund te parashikohen.
eshte ne rastesi e konsiderueshme e involvuar ne rezultatin e zarit,
dhe per ate, de e quajme te paparapare.
Me lejoni te flas per diskreten dhe te vazhdueshmen.
Nje ambient diskret eshte ai ambient ku ju keni numer te fundshem te zgjidhjeve,
dhe numer te fundshem te gjerave qe mund ti njeni.
Pra, p.sh, ne lojen e shahut, prap, ka nje numer te fundshem te fushave ne tabele,
dhe numer te fundshem te levizje qe mund te beni.
Kjo eshte ndryshe pre ambientit te vazhdueshem
kur hapsira e veprimeve te mundshme, apo gjerave qe mund te ndjeni mund te jene te pafundshme.
Pra, p.sh, nese gjuani me shiqgjete, ka numer te pafundshem te menyrave te drejtimit te shigjetes
dhe forces shtytese te perdorur.
Perfundimisht, ne dallojme ambientet dashamirese me ato kundershtuese.
ne ambientet dashamirese, ambienti mund te jete i rastesishem.
mund te jete i paparapare, por nuk ka objektive te veten
qe mund ta kundershtoje objektiven tone.
Pra, p.sh. koha eshte dashamirese.
Mund te jete e rastesishtme, Mund te kete efekt ne rezultatet e veprimeve tuaja.
por nuk do te thot qe ky eshte qellimi i kohes.
Per dallim nga ambienti i kundershtueshem, si shume loje, si shahu,
ku qellimi eshte per te fituar ndaj jush.
do te thote eshte shume me veshtire per te gjetur veprime te mira ne ambiente te kundershtueshme
Ku kundershtari pa nderprere ju observon dhe vepron ne menyre te kundert me qellimet e tuaja
per dallim nga ambienti dashamires, ku ambienti mund te jete thjesh i paparapare
por nuk eshte i interesuar per t'ua veshtiresuar jeten.
Pra te shohim se sa i keni kuptuar keto terme
duke shkuar te kuizi yne i rradhes.
Pra ja ku i kemi 4 konceptet: pjeserisht dhe komplet i observueshem,
i determinueshem dhe i paparapare, vashdueshem dhe diskret,
dhe dashamires dhe i kundershtueshem.
t'ju pyes per lojen e checkers.
Nenvizo alternativat e sakta
Pra nese mendoni se chechers eshte pjeserisht i observueshem, nenvizoni kete.
perndryshe vetem mos e nenvizoni.
Nese mendoni se eshte i paparapare, nenvizoni kete,
I vazhdueshem nenvizoni kete, i kundershtueshem nenvizoni kete.
Nese nuk e dini lojen "checkers", mund te kontrolloni ne google
per te gjete informacione pak me shume per checkers.