1 - Diskuter hvorfor gjenkjennelse av objekter er et vanskelig beregningsproblem. Flashcards
Hva er objektgjenkjenning, hva er et beregningsproblem, datamaskiner, noen av vanskelighetene er…
Objekt gjenkjenning er en kompleks kognitiv prosess som lar oss identifisere og kategorisere objekter i miljøet vårt. Det er en kompleks prosess der hjernen må transformere input fra det ytre miljøet til meningsfulle representasjoner. Objekt gjenkjenning er et vanskelig beregningsproblem.
Et beregningsproblem betyr i denne sammenhengen utfordringene og kompleksiteten ved å gjenkjenne objekter ved hjelpe av beregninger eller algoritmer. Det har vist seg å være utfordrende å programmere datamaskiner til å kunne gjenkjenne objekter på samme nivå som mennesker klarer å gjenkjenne objekter. Noen av vanskelighetene datamaskiner møter på er at stimulusen på reseptorene er tvetydige, objekter i en scene kan være skjulte eller uskarpe og objekter kan se forskjellige ut fra ulike synsvinkler, og disse aspektene skal jeg nå gå litt mer inn på.
Beskriv det inverse projeksjonsproblemet.
Oppgaven med å bestemme objektet som forårsaker et bestemt bilde på netthinnen, kalles det inverse projeksjonsproblemet. Når mennesker skal bestemme hva slags objekt som er årsaken til et spesifikt bilde på netthinnen så gjør vi dette relativt enkelt, selv om det egentlig er flere objekter i miljøet rundt oss som kan skape det samme bilde i 2D på netthinnen. Derfor kan vi si at bildet på netthinnen er tvetydig og vi må på en eller annen måte finne ut nøyaktig hva som blir presentert for oss. Dette er noe som har vist seg å være meget utfordrende for et datasynssystem.
Si litt om når et objekt er gjemt.
Noen ganger er objekter gjemt eller uskarpt. Det at et objekt er delvis skjult av et annet objekt er noe som skjer ofte i omgivelsene våre, og mennesker skjønner enkelt at den delen av objektet som er skjult fortsatt eksisterer. For eksempel hvis det under en avis ligger en penn, som er delvis skjult av avisa, vil mennesket lett forstå at den delen av pennen som er skjult eksisterer. Det betyr at hjernen må kunne fylle ut manglende informasjon og gjøre slutninger om de skjulte delene av objekter.
Si litt om når et objekt er uskarpt. Eksempel med kjendiser, hva viser dette eksemplet?
Mennesker klarer også å gjenkjenne objekter som ikke er i skarpt fokus. I en oppgave der mennesker og en datamaskin skulle gjenkjenne uskarpe bilder av kjendiser, gjorde menneskene det relativt bra, mens datamaskiner gjorde det dårlig. Menneskers prestasjon på en slik oppgave får mye hjelp far det faktum at vi har sett disse ansiktene mange ganger før, slik at vi på en måte bare «vet» hvordan disse kjente menneskene ser ut. Dette eksemplet fra en studie viser at også andre kognitive prosesser spiller en rolle.
Si litt om problemet med at objekter ses fra forskjellige vinkler.
Et tredje problem for maskiner som skal persipere er at objekter ofte ses fra forskjellige vinkler. Dette betyr at bildene av objekter er kontinuerlig endring, avhengig av hvilken vinkel man ser det fra. Mennesker oppfatter et objekt fra forskjellige vinkler som det samme objektet, men dette er ikke like åpenbart for en datamaskin. Denne evnen til å gjenkjenne et objekt sett fra ulike synsvinkler kalles synsvinkel invarians.
Hvorfor er mennesker bedre i stand til å oppfatte og gjenkjenne objekter og scener enn datamaskiner?
En av grunnene til at mennesker er i stand til å oppfatte og gjenkjenne objekter og scener så mye bedre enn datastyrte roboter, er at systemet vårt er tilpasset til å reagere på de fysiske egenskapene til miljøet vårt, som objekters orientering og lysretningen. Men denne tilpasningen går utover bare fysiske egenskaper. Det oppstår også fordi vi har lært om hvilke typer objekter som vanligvis forekommer i bestemte typer scener. Dermed ser man at det ikke bare er persepsjon som spiller en rolle, men også andre kognitive prosesser slik som læring og hukommelse.