Created by Marina Kasper
over 5 years ago
|
||
Question | Answer |
Warum ist maschinelles Sehen so schwierig? | - der Stimulus an den Rezeptoren ist mehrdeutig: Problem der inversen Projektion, d.h. anhand des Bildes der Retina das Objekt bestimmen - Objekte können verdeckt oder unscharf sein - Objekte sehen aus verschiedenen Blickwinkeln unterschiedlich aus: Blickwinkelinvarianz |
der gestaltpsychologische Ansatz zur perzeptuellen Gruppierung | - Strukturalismus: Unterscheidung in Empfindungen (elementare Prozesse, die durch die Stimulation der Sinne zustande kommen) und Wahrnehmungen (dem komplexen bewussten Erleben); Wahrnehmung nicht als Summe von Empfindungen - Scheinbewegung: das Ganze ist mehr als die Summe der Teile; Dunkelheitsphasen werden mit der Wahrnehmung eines sich bewegenden Bilds aufgefüllt - Scheinkonturen: z.B. Dreiecks-Illusion |
die Gestaltprinzipien | - guter Verlauf: Punkte, die als gerade oder sanft geschwungene Linien gesehen werden, wenn man sie verbindet, werden als zusammengehörig wahrgenommen; Linien und Oberflächen folgen dem einfachsten Weg - Prägnanz: jedes Reizmuster wird so gesehen, dass die resultierende Struktur so einfach wie möglich ist - Ähnlichkeit: Ähnliche Dinge erscheinen zu Gruppen geordnet - Nähe: Dinge, die sich nahe beieinander befinden, erscheinen als zusammengehörig - gemeinsames Schicksal: Dinge, die sich in die gleiche Richtung bewegen, werden als zusammengehörig wahrgenommen - gemeinsame Region: Elemente, die innerhalb einer gemeinsamen Region liegen, werden zusammengruppiert - Verbundenheit von Elementen: Verbundene Elemente innerhalb einer Region mit gemeinsamen visuellen Charakteristiken wie Helligkeit, Farbe, Textur oder Bewegung werden als Einheit gesehen |
perzeptuelle Segmentierung | Merkmale des Problems der Figur-Grund-Unterscheidung: die Figur wirkt dinghafter und ist leichter im Gedächtnis zu behalten; die Figur wird als vor dem Hintergrund stehend gesehen; der Grund wird als ungeformtes Material ohne eigene Gestalt gesehen; die Figur besitzt Kontur - Bildmerkmale, die bestimmen, welche Fläche als Figur wahrgenommen wird: tiefer liegende Flächen werden eher als Figur wahrgenommen; konvexe Seite wird eher als Figur wahrgenommen als konvake Seite - subjektive Faktoren bestimmen, was Grund ist |
physikalische Regelmäßigkeiten bei der Szenenwahrnehmung | - Oblique-Effekt: horizontale und vertikale Orientierungen werden leichter erkannt als schräge - Objekte in einer Umgebung weisen oft eine gleichmäßige Farbe auf; benachbarte Objekte unterschieden sich in ihren Farben - Licht-von-oben-Heuristik, d.h. es wird angenommen, dass Licht von oben kommt |
semantische Regelmäßigkeiten bei der Szenenwahrnehmung | Funktionsmerkmale, die mit Vorgängen in den verschiedenen Szenen verbunden sind |
Theorie der unbewussten Schlüsse | einige unserer Wahrnehmungen sind das Ergebnis unbewusster Annahmen, die wir über die Welt machen |
Wahrscheinlichkeitsprinzip der Wahrnehmung | Wahrnehmung des Objekts, das die größte Auftretenswahrscheinlichkeit dafür aufweist, das von uns empfangene Reizmuster verursacht zu haben |
offene Aufmerksamkeit | gekennzeichnet durch die mit Hilfe von Augenbewegungen vollzogene Ausrichtung der Fovea centralis auf das wahrzunehmende Ereignis; anhand des Posner-Paradigmas untersuchbar |
verdeckte Aufmerksamkeit | bei der unabhängig von Kopf- oder Augenbewegungen auf neuronaler Ebene eine trennende Verarbeitung situationsrelevanter und -irrelevanter Stimuli erfolgt. Diese Stimulusselektion findet bereits vor dem Einsetzen von Kopf- oder Augenbewegungen statt. |
endogene Aufmerksamkeit | - eigene Aufmerksamkeit kontrollieren - endogene Hinweisreize stehen unter der kognitiven Kontrolle der Person und brauchen mehr Vorlaufzeit als exogene Hinweisreize |
exogene Aufmerksamkeit | - Aufmerksamkeit wird von außen ausgelöst - exogene Hinweisreize ziehen die visuellen Hinweisreize automatisch auf sich |
Posner-Paradigma | - Untersuchung der Verlagerung der räumlichen Aufmerksamkeit - es werden zwei Buchstaben repräsentiert und die Person muss entscheiden, um welchen es sich handelt - dabei weiß sie nicht, an welcher räumlichen Position die Stimuli präsentiert werden - Blickbewegungen sind aufgrund der Kürze nicht möglich - Aufmerksamkeit der Person wird durch Hinweisreize gesteuert -> kürzere Reaktionszeiten bei validen Hinweisreizen und höhere Anwortrichtigkeit bei schwierigen Aufgaben spricht dafür, dass die visuelle Aufmerksamkeit die Reizverarbeitung effizienter macht |
Scheinwerfer-Metapher | - Aufmerksamkeit wird mit einem Scheinwerferstrahl verglichen, der bestimmte Positionen des Blickfelds erleuchtet - dort stehen dann größere Verarbeitungsressourcen zur Verfügung, die die Verarbeitung schneller und genauer machen |
Versuche von Moran und Desimone | - verglichen wie Zellen auf einzelne Reize reagierten; bei einem optimalen Reiz war die Reaktion stark und bei einem ungeeigneten Reiz war sie schwach - wurden beide Reize gleichzeitig repräsentiert, ergab sich ein Kompromiss - wurde die Aufmerksamkeit nur auf einen der beiden Reize gelenkt, wurde der andere ausgeblendet -> visuelle Aufmerksamkeit kann die Aktivität von Nervenzellen hoch oder herab setzen |
Carrasco-Paradigma | - Hinweisreize erscheinen an der Stelle des Gitters mit niedrigerem Kontrast - durch die unwillkürliche Ausrichtung der Aufmerksamkeit auf diesen Reiz erhöht sich der wahrgenommene Kontrast des Gitters |
Paradigma der visuellen Suche | - ein zuvor vereinbarter Zielreiz soll unter Distraktionen gefunden werden - Pop-out-Effekt - Unterscheidung in attentiver Verarbeitung, d.h. der Einsatz von Aufmerksamkeit, und präattentiver Verarbeitung, d.h. ohne Aufmerksamkeit - bei einer Unterscheidung in einem einfachen Merkmal hängen die Suchzeiten nicht von der Zahl der Distraktoren ab - bei Konjunktionen von Merkmalen, steigen die Suchzeiten linear mit der Zahl der Distraktionen |
Treismans Merkmals-Integrations-Theorie | - unterschiedliche Reizmerkmale werden getrennt verarbeitet - das visuelle System verfügt über Merkmalskarten, die das gesamte Blickfeld in Bezug auf jeweils ein bestimmtes Reizmerkmal abbilden - alle Merkmalskarten sind mit einer räumlichen "Hauptkarte der Positionen" verbunden - visuelle Aufmerksamkeit kann eingesetzt werden, um eine bestimmte räumliche Position (Hauptkarte -> Merkmalskarte, es entsteht eine Objekt-Datei) oder ein bestimmtes Merkmal (Merkmalskarte -> Hauptkarte) zu suchen - serielle Suche |
Wolfes Modell der geleiteten Suche | - die Aktivität der einzelnen Merkmalskarten wird aktiviert und taucht in der Hauptkarte auf - hohe Salienz/Auffälligkeit von Objekten, d.h. Pop-Out-Objekte - Gewichtung von Merkmalen möglich - Aufmerksamkeit als Folge der Aktivierung der Merkmalskarten - flexibler, bestimmte Suchmerkmale werden durch Kontrollprozesse hervorgehoben - Beispiel: Suche nach einer Person mit roter Jacke in einer Menschenmenge |
Change Blindness Paradigma | - inhaltlich bedeutsame Aspekte visueller Szenen werden bevorzugt verarbeitet und früher abgesucht als inhaltlich unbedeutsame - räumliche Aufmerksamkeit wird durch inhaltliche Aspekte geleitet - läuft vorausgehende semantische Verarbeitung unbewusst ab? |
Resinks Theorie der Proto-Objekte | - zunächst haben wir einen unmittelbaren bewussten Eindruck einer Szene; Objekte werden als Proto-Objekte repräsentiert - durch die Aufmerksamkeit werden die Proto-Objekte zugangsbewusst, d.h. kognitiven Kontrolloperationen zugänglich |
Bindungsproblem | - Reize werden in Einzelmerkmale aufgegliedert und müssen später wieder zusammengefügt werden - Mögliche Lösungsansätze: es gibt hochspezialisierte Zellen, die auf bestimmte Kombinationen von Merkmalen reagieren; Zellverbände, die gemeinsam das Objekt kodieren; alle Merkmals-Detektoren, die sich auf das gleiche Objekt beziehen, feuern mit derselben Rate -> Aufmerksamkeitszuwendung prüft die beachteten Merkmale auf Zusammengehörigkeit und fasst sie zu einer gemeinsamen Objektrepräsentation zusammen |
Farbwahrnehmung durch Wellenlängen | - die Farben des Lichts hängen mit den Wellenlängen des sichtbaren Spektrums zusammen - die Farben von Objekten hängen mit den Wellenlängen zusammen, die reflektiert (undurchsichtiges Objekt) oder transmittiert (durchsichtiges Objekt) werden |
additive Farbmischung bei Licht | - alle Wellenlängen, die bei Licht nur einer Farbe reflektiert werden, werden genauso auch bei der Superposition beider Lichter reflektiert - bei der Überlagerung von Licht addieren sich die Wellenlängenanteile - Beispiel: blaues, kurzwelliges und gelbes, mittel- und langwelliges Licht, das auf eine weiße Fläche reflektiert wird, addiert sich zu weißem Licht |
subtraktive Farbmischung bei Pigmentfarben | - jede Pigmentfarbe absorbiert dieselben Wellenlängen, die jedes Pigment allein absorbiert, auch in der Farbmischung - in der Mischung werden dann nur diejenigen Wellenlängen reflektiert, die von keiner der ursprünglichen Farben absorbiert wurden - Beispiel: ein blaues Pigment absorbiert blaues Licht und reflektiert Licht mit mittleren Wellenlängen, ein gelbes Pigment absorbiert gelbes Licht und reflektiert mittlere Wellenlängen, bei einer Mischung werden nur die mittleren Wellenlängen reflektiert, was als Grün wahrgenommen wird |
Dreifarbentheorie | - Farbensehen basiert auf drei Rezeptorsystemen mit unterschiedlichen spektralen Empfindlichkeiten |
der Zusammenhang zwischen der Aktivierung der Zapfenpigmente und der Farbwahrnehmung | - die drei verschiedenen Zapfenpigmente unterscheiden sich strukturell in der Größe der Opsinkomponente, was zu den unterschiedlichen Absorptionsspektren führt - beim Farbabgleichexperiment wird die Farbe in einem Vergleichsfeld durch das Regulieren dreier verschiedener Wellenlängenkomponenten mit der Farbe im Testfeld in Übereinstimmung gebracht - es entsteht Metamerie, d.h. zwei physikalisch unterschiedliche Stimuli sind perzeptuell identisch, die durch dasselbe Aktivitätsmuster in den drei Zapfenrezeptortypen hervorgerufen wird |
Sind für das Farbensehen drei Rezeptorsysteme notwendig? | - bei der Absorption von Licht verändert das Retinal ausgelöst durch Photonen seine Form (Isomerisierung) - durch die Isomerisierung wird der Rezeptor aktiviert, der ein elektrisches Signal aussendet, was zur Wahrnehmung des Lichts führt - Univarianzprinzip, d.h. die Absorption eines Photons hat unabhängig von der Wellenlänge immer denselben Effekt; im Rezeptor kann die Wellenlänge des absorbierten Lichts nicht mehr identifiziert werden, sondern nur noch die Gesamtzahl der absorbierten Photonen - eine Person mit nur einem Sehpigment kann die verschiedenen Wellenlängen als unterschiedliche Grautöne wahrnehmen - durch ein zweites Sehpigment wird Farbensehen möglich, da dann die Absorptionen unterschiedlicher Wellenlängen ins Verhältnis gesetzt werden können und unterschieden werden können - das Hinzufügen eines dritten Pigments ist zwar nicht notwendig, aber es erhöht die Anzahl an Farben, die wir sehen können |
Farbfehlsichigkeit | - Monochromasie: Farbenblindheit; nur ein Sehpigment oder nur Stäbchen; anhand der Intensität kann Übereinstimmung mit jedem Farbton des Spektrums hergestellt werden, indem die Intensität der jeweiligen Wellenlänge variiert wird, bis sie mir der Vergleichswellenlänge übereinstimmt - Dichromasie: Farbenfehlsichtigkeit; es werden nur zwei Wellenlängen benötigt, um Farbübereinstimmung mit allen anderen Wellenlängen desselben Spektrums herzustellen - anormale Trichromasie: Farbfehlsichtigkeit; es werden drei Wellenlängen zur Herstellung einer Farbübereinstimmung mit einer beliebigen Wellenlänge benötigt; allerdings werden die Wellenlängen zu anderen Anteilen gemischt und beieinander liegende Wellenlängen können nicht so gut unterschieden werden |
Gegenfarbentheorie | - Farbensehen beruht auf gegensätzlichen Antworten, die durch Blau und Gelb bzw. Rot und Grün ausgelöst werden - Simultankontrast, d.h. eine Fläche verändert ihre Farbe, sobald man sie mit einer anderen Farbe umgibt - Gegenfarbenzellen, die auf Licht aus einem Teil des Spektrums exzitatorisch und aus einem anderen Teil des Spektrums inhibitorisch reagieren |
Vereinbarkeit von Dreifarbentheorie und Gegenfarbentheorie | - zuerst reagieren die Rezeptoren mit unterschiedlichen Antwortmustern auf unterschiedliche Wellenlängen (Dreifarbentheorie) - später integrieren Neurone die hemmenden und erregenden Signale von den Rezeptoren (Gegenfarbentheorie) - das unterschiedliche Feuern von Rezeptorpaaren, d.h. die Differenz der Antworten dieser Paare, wird zum Farbsignal - Beispiel: ein L+M-Neuron erhält vom L-Rezeptor exzitatorische Signale und vom M-Rezeptor inhibitorische Signale; das Neuron summiert ein 500nm-Licht, das ein inhibitorisches Signal der Stärke -80 und ein exzitatorisches Signal der Stärke +50 erzeugt, zu -30 auf |
zwei Arten von Gegenfarbenneuronen im Kortex | - einfache Gegenfarbenneuronen für die Farbwahrnehmung innerhalb von einzelnen Bereichen - Doppel-Gegenfarbenneuronen für Farbgrnezen zwischen solchen Bereichen |
Farbkonstanz | - Farben von Objekten werden als vergleichsweise konstant wahrgenommen, selbst unter veränderten Bedingungen Gründe: - Farbadaption, d.h. Farbwahrnehmung kann sich durch längere Einwirkung einer chromatischen Farbe ändern; das Auge kann seine Empfindlichkeit für verschiedene Wellenlängen anpassen, um Farbwahrnehmung unter verschiedenen Beleuchtungsbedingungen annährend konstant zu halten - Einfluss des Umfelds, da das visuelle System die Art der Beleuchtung von Objekten in der Szenerie als Information nutzt, um die spektralen Eigenschaften der Beleuchtung zu berücksichtigen - Gedächtnis und Farbe |
Helligkeitskonstanz | - Konstanz von achromatischen Farben (weiß, schwarz, grau) unter Beleuchtungsveränderungen - die Menge des vom Objekt ins Augen gelangenden Lichts hängt von der Beleuchtung und von der Reflektanz des Objekts ab - Wahrnehmung der Helligkeit hängt nicht mit der Lichtmenge zusammen, die von dem Objekt reflektiert wird, sondern vom Anteil des von diesem Objekt reflektierten Lichts, der unabhängig von der Beleuchtung derselbe ist |
Gründe für Helligkeitskonstanz | - das Verhältnisprinzip: Zwei Flächen, die unterschiedlich viel Licht reflektieren, sehen gleich aus, wenn die Verhältnisse ihrer Lichtintensitäten den den Intensitäten ihrer Umfelder dieselben sind, z.B. gleichmäßig ausgeleuchtetes Schachbrett - Helligkeitswahrnehmung unter ungleichmäßiger Beleuchtung: Schatten (Unterscheidung in Reflektanz- und Beleuchtungskanten); damit Helligkeitskonstanz funktioniert, benötigt man Informationen über Schatten und adäquate Informationen über Beleuchtungsbedingungen |
okulomotorische Tiefenhinweise | - die Tiefenhinweise basieren auf unserer Fähigkeit, die Stellung unserer Augen und die Spannung in unseren Augenmuskeln wahrzunehmen - die Tiefenhinweise, also dass ein Objekt nahe ist, entstehen durch Konvergenz (die nach innen gerichtete Bewegungen der Augen) und Akkomodation (die Veränderung der Form der Augenlinse beim Fokussieren von Objekten unterschiedlicher Distanz) |
monokulare Tiefenhinweise | - Tiefenhinweise, die auch beim Sehen mit nur einem Auge funktionieren - die Tiefenhinweise entstehen durch Akkomodation und bildbasierte (die in einem zweidimensionalen Bild enthaltene Informationen zur räumlichen Tiefe) und bewegungsinduzierte (die durch Bewegung erzeugte Tiefeninformation) Tiefenhinweise |
monokulare Tiefenhinweise: Bildbezogene Tiefenhinweise | - Verdeckung, d.h. wenn ein Objekt durch ein davor platziertes anderes Objekt nicht mehr sichtbar ist - relative Höhe, d.h. Objekte, deren Grundfläche im Gesichtsfeld näher am Horizont liegt, als weiter entfernt gesehen - relative Größe, d.h. bei gleich großen Objekten dasjenige, das weiter entfernt ist, einen kleineren Bereich im Gesichtsfeld einnimmt als das nähere - perspektivische Konvergenz, d.h. parallele Linien scheinen sich in einem fernen Punkt zu schneiden - vertraute Größe, d.h. Beurteilungen von Entfernungen über die Größe von Objekten - atmosphärische Perspektive, d.h. Objekte wirken weniger scharf und besitzen einen leicht blauen Farbstich - Texturgradient, d.h. Elemente, die in einer Szene gleiche Abstände aufweisen, erscheinen mit zunehmender Distanz dichter gepackt - Schatten |
monokulare Tiefenhinweise: Bewegungsinduzierte Tiefenhinweise | - Bewegungsparallaxe, d.h. während unserer Fortbewegung sehen wir nahe gelegene Objekte an unserer Seite rasch vorbeigleiten, entferntere Objekte sich hingegen langsamer an uns vorbei bewegen - Zu- oder Aufdecken, d.h. wenn sich ein Beobachter zur Seite bewegt, werden manche Objekte in seinem Blickfeld durch davorstehende Objekte verdeckt und andere Objekte wieder sichtbar |
binokulare Tiefenhinweise | - unterschiedliche Ansichten der Augen sind Grundlage der stereoskopischen Tiefenwahrnehmung, d.h. der Tiefenwahrnehmung, die aus den Eingangssignalen beider Augen berechnet wird |
von der Disparität zur Stereopsis | - bei 3D-Filmen nutzen wir binokulare Tiefenhinweise; in beiden Augen entstehen voneinander abweichende Netzhautbilder (Querdisparität) - Erzeugung von Querdisparität durch Rot-Grün-Felder oder Polarisationsmethode passive Methode: zwei verschieden polarisierte Bilder werden beiden Augen gleichzeitig dargeboten und durch eine Polarisationsbrille betrachtet aktive Methode: die elektronische 3D-Brille ändert synchron zur Frequenz, mit der die TV-Bilder erzeugt werden, die Durchlässigkeit der Polarisationsgläser dritte Methode: Bildschirm mit Linsenoptik, der mit einem Film überzogen ist, in dem zwei Arten von Linsen eine lentiforme Projektion erzeugen, so dass beide Augen unterschiedliche Bilder erhalten - Zufallspunktstereogramm |
Korrespondenzproblem | - wie bringt das visuelle System die Bilder in beiden Augen in Übereinstimmung? - möglicherweise Vergleich der Bilder |
Ergebnis des Experiments von Holways und Borings | - Größenschätzung beruht auf der tatsächlichen Größe von Objekten, wenn viel Tiefeninformation vorhanden ist - Größenschätzung ist sehr stark vom Sehwinkel eines Objekts beeinflusst, wenn Tiefeninformation fehlt |
Größenkonstanz | die Tatsache, dass unsere Wahrnehmung von Objekten vergleichsweise konstant bleibt, wenn wir sie aus unterschiedlichen Entfernungen betrachten Gründe: - Größen-Distanz-Skalierung - relative Größe anderer Objekte - Beziehung zwischen Objekten und Textinformation |
Größen-Distanz-Skalierung | Gw = K * (Gr * Dw) Gw = wahrgenommene Größe eines Objekts K = Konstante Gr = Größe des retinalen Bilds Dw = wahrgenommene Distanz - während sich eine Person entfernt, wird das Bild Gr auf der Netzhaut kleiner, aber gleichzeitig wird die wahrgenommene Distanz Dw größer - wird dagegen nur die wahrgenommene Distanz größer während das Netzhautbild konstant bleibt, dann verändert sich auch die wahrgenommene Größe des Objekts |
Emmert'sches Gesetz | - die Beziehung zwischen der scheinbares Distanz des Nachbilds und der wahrgenommenen Größe - je weiter ein Nachbild entfernt ist, desto größer wird es: Gw ~ Gr * Dw; die Größe Gr des gebleichten Bereichs auf der Retina bleibt konstant, also führt eine Steigerung der Distanz Dw zu einer Steigerung des Produkts Gr * Dw |
Gründe für die Müller-Lyer-Täuschung | eine Linie erscheint länger als die andere, obwohl beide gleich lang sind - fälschlich angewandte Größen-Distanz-Skalierung, d.h. kann zu Täuschungen führen, wenn sie auf gezeichnete Figuren in der zweidimensionalen Papierebene angewandt werden; die wahrgenommene Größe Gw wird durch die wahrgenommene Distanz Dw bestimmt, da die Größen der retinalen Bilder Gr beider Linien identisch sind - Theorie der Wahrnehmungskompromisse, d.h. Wahrnehmung der Linien hängt von der tatsächlichen Länge der Linien und der Gesamtlänge der Figuren ab, die konkurrierende Hinweisreize sind |
Gründe für die Ponzo-Täuschung | Beispiel Bahngleise - der Skalierungsmechanismus rechnet räumliche Tiefe ein, obwohl in Wirklichkeit keine räumliche Tiefe existiert, da die Täuschung auf einer zweidimensionalen Buchseite abgebildet ist |
Gründe für den Ames'schen Raum | zwei gleich große Menschen wirken so, als ob sie sich in der Körpergröße sehr stark unterscheien würden in diesem Raum - der Raum sieht wie ein ganz normales rechteckiges Zimmer aus, aber er ist so gebaut, dass seine linke Ecke fast doppelt so weit vom Betrachter entfernt ist wie seine rechte Ecke - die wahrgenommene Distanz Dw ist bei beiden Frauen dieselben, aber die Größe des retinalen Bildes Gr der einen Person ist geringer, daher ist ihre wahrgenommene Größe Gw ebenfalls geringer - Vergleich der relativen Größen |
die Mondtäuschung | die wahrgenommene Vergrößerung des Monds nahe dem Horizont im Vergleich zum Mund hoch oben am Himmel - Erklärung für die wahrgenommene Entfernung, d.h. der Mond nahe am Horizont über einer Landschaft oder einem Gelände wird voller Tiefeninformation gesehen, der Mond erscheint weiter entfernt und wirkt größer - die Bildgröße Gr ist bei beiden Positionen gleich, weil der Sehwinkel gleich bleibt; aber in der größeren Entfernung erscheint der Mond größer (Emmert'sches Gesetz) - Sehwinkelkontrast, d.h. der Mond wirkt kleiner, wenn er von größeren Objekten umgeben ist |
Want to create your own Flashcards for free with GoConqr? Learn more.