Audio Flashcards
Was sind Auditory Icons?
akustische Symbol, welches Objekt oder Vorgang im UI darstellt
Was sind Earcons?
synthetisches Geräusch zur abstrakten Codierung von Information im UI
Was ist der Unterschied zwischen Auditory Icons und Earcons?
Bedeutung von Auditory Icons ist von natürlichen Geräuschen abgeleitet und die Bedeutung von Earcons muss erlernt werden
Was ist Schall?
mechanische Bewegung eines physikalischen Mediums, die sich als Druckwelle ausbreitet
Gibt es Schall ohne Medium?
Nein, siehe Weltall
Wie können sich Wellen ausbreiten?
Longitudinalwelle: Oszillatoren schwingen in der Ausbreitungsrichtung
Transversalwelle: Oszillatoren schwingen quer zur Ausbreitungsrichtung
Sind Schallwellen longitudinal oder transversal?
longitudinal
Wie breiten sich Schallwellen aus und wie schnell?
- Schallwellen breiten sich im Raum konzentrisch um Entstehungspunkt aus
- Schallwellen breitet sich in unterschiedlichen Medien mit unterschiedlichen Ausbreitungsgeschwindigkeiten aus
– Beispiele: Luft: 331m/s bei 0°C und 343m/s bei 20°C
Wie unterscheiden sich Töne und Geräusche?
- unregelmäßige Luftdruckschwankungen werden als Geräusche wahrgenommen
- peridische Luftdruckschwankungen werden als Ton wahrgenommen
Wo liegt das hörbare Frequenzspektrum?
20Hz bis 20kHz
Wo liegt der Frequenzbereich der Sprache?
300Hz bis etwas mehr als 3,3kHz
Was ist die Tonhöhe?
Grundfrequenz, psyhoakustische Größe
Wie hoch ist die Diskriminierungsfähigkeit des Menschen in Frequenz?
1,5Hz
Wovon hängt die wahrgenommene Lautstärke ab?
- Schalldruckpegel
- Frequenzspektrum
- Zeitverhalten des Schalls
Wie berechnet sich Dezibel?
Wie werden Töne erzeugt?
Gegenstand wird in Schwingung versetzt
Wie wird die Schwinung der n-fachen Grundfrequenz genannt?
n-te Harmonische oder (n-1)-ter Oberton
Wie ergibt sich eine Klangfarbe?
- Klangfarbe eines Tons ist spezi!sches Gemisch aus Grundton und Obertönen
– hängt von Bescha$enheit des Tonerzeugers (z. B. Instrument, Singstimme) ab
– Klangfarbe und (Ein-)schwingverhalten lassen uns Töne auditiv unterscheiden
Was ist die Fouriertransformation?
Was ist das Musical Instrument Digital Interface (MIDI)?
Protokoll für Austausch musikalischer Steuerinformationen zwischen elektronischen Instrumenten
Was entspricht der wahrnehmnbaren Tonhöhe beim Computer?
Grundfrequenz
Was entspricht der wahrnehmnbaren Lautstärke beim Computer?
Druckamplitude
Was entspricht der wahrnehmnbaren Klangfarbe beim Computer?
Frequenzspektrum
Beschreibe das Weber-Fechenr Gesetz
Wie kann man das Weber-Fechenr-Gesetz experimentell untersuchen?
durch just noticeable difference experimente
Von wo bis wo geht das Außenohr?
beginnt bei Ohrmuschel und geht über Gehörgang zum Trommelfell
Von wo bis wo geht das Mittelohr?
beginnt beim Trommelfell, geht über Gehörknöchelchenkette bis zur Schnecke (Cochlea)
Von wo bis wo geht das Innenohr?
ist Schnecke und Hörnerv
Wie findet Hören statt?
- nach Transduktion (Umwandlung von Schallwellen in neuronale Impulse)
- Gruppierung der Klangbilder
- Szenenanalyse und Extraktion von auditiven
Eigenschaften - Interpretation der auditiven Umgebung
Wie können Geräusche lokalisiert werden?
Lokalisierung (Bestimmung von Richtung und Distanz) von Geräuschquellen wird durch
– interaurale Zeitunterschiede
– interaurale Pegelunterschiede
Wie werden Informationen über die Distanz von einem Geräusch generiert?
- Geräuschspektrum: entfernte Geräusche klingen dumpfer (Beispiel: Gewitter)
- Lautstärke: entfernte Geräusche sind leiser
- Bewegungsparallaxe: nahe Geräusche bewegen sich schneller am Hörer vorbei als entfernte
- Reflektionen: in geschlossenen Räumen erreicht Direktschall Hörer schneller als die Reflexionen; Verhältnis gibt Aufschluss über Distanz
Worauf beschränkt man sich bei der Digitalisierung von Audio? (in db und hz)
20Hz bis 20kHz
0dB bis 120dB
Wie oft muss bei der Digitalisierung von Audio abgetastet werden und wie hoch ist die Bit-Auflösung?
44.100Hz abgetastet und 8-24 Bit Auflösung
Wie funktioniert die Pulse Code Modulation?
- Messwere werden als Bitfolgen hintereinander geschrieben
Wie funktioniert die Differential Pulse Modulation?
Übertragung der Differenz zwischen zwei Messsignalen statt absoluter Werte
Wie funktioniert die Adaptive Differential Pulse Code Modulation?
Anzahl/Wichtung der Differenz verwendeten Bits ist variabel
Was macht sich MP3 zunutze?
Maskierungseffekte bzgl. 27 kritischen Bändern
Was sind die sog. 27 kritischen Bänder?
Auswertung des Gehörten erfolgt in
Frequenzgruppen
Wann tritt eine Maskierung bei Tönen ein?
Bei höherer Lautstärke und ähnlicher Frequenz
Was ist die Vorwärtsmaskierung?
- Tonsignal schwächt Wahrnehmung späterer (bis max. 200 ms) Tonsignale in Umgebung
- Haarzellen benötigen Erholungszeit (engl. Recovery Time) nach lauterem Signal
Was ist die Rückwärtsmaskierung?
- Bei Rückwärts-Maskierung maskiert verschleiernder Ton den zuvor (10…20 ms) aufgetretenen Ton
- während dieser Zeit wird ähnlicher, leiserer Ton nicht wahrgenommen
Was geschieht während der Filterbank?
MP3-Kompression
unterteilt zu kodierendes Audiosignal in 32 Subbänder, die 27 kritischen Bänder approximieren
Wie wird ein Audiosignal in 32 Subbänder eingeordnet?
Durch Bandpass-Filter
- bei Bandpass-Filter werden Frequenzen zwischen beiden Grenzfrequenzen durchgelassen, andere abgeschwächt
Was geschieht während des MDCT?
MP3-Kompression
Umcodierung der Signalwerte vom Zeitbereich in Frequenzbereich
- Betrachtung für alle Subbänder getrennt
- 32 Subbänder werden jeweils durch modifizierte diskrete Kosinus- Transformation (MDCT) durch 18 Basisfrequenzen im jeweiligen Subband dargestellt
Was geschieht während “Psychoakustisches Modell (32 Bänder, Maskierung)”?
MP3-Kompression
Was ist Advanced Audio Coding (AAC)?
- von MPEG-Arbeitsgruppe entwickeltes, verlustbehaftetes Kompressionsverfahren
- Weiterentwicklung von MPEG-2
Welche Profile gibt es bei AAC?
- Low Complexity
- Low Delay
- High Efficiency
- Scalable Sample Rate (SSR)
Was ist Spektalbandreplikation?
nur niedrige Frequenzanteile werden übertragen und daruas die höheren bei Ausgabe abgeleitet
Was ist zeit-invariante Audioverarbeitung?
ändert nicht die Länge des Signals
Was ist der Maximalpegel?
höchster darstellbarer Signalwert (=größte darstellbare Zahl im Quantisierungsbereich)
Was ist der Headroom?
bezeichnet Abstand zwischen Arbeitspegel und Maximalpegel
Was ist der Footroom?
bezeichnet Abstand zwischen leisesten auftretendem Signal und Rauschen des Systems
Was ist der Störabstand?
oder Signal-Rausch-Abstand bezeichnet Abstand zwischen Arbeitspegel und Rauschen
Was ist die Pegelanpassung?
bezeichnet Veränderung aller Signalwerte um konstanten Faktor
Was ist Über- bzw. Untersteuerung?
Was bezeichnet man als Normalisierung?
- Um Über- bzw. Untersteuerung entgegen zu wirken, wird Pegel eines Audiosignals vor Verarbeitung auf 0dB (Arbeitspegel) angehoben bzw. gesenkt
- Kompensation eines eventuell vorhandenen DC-O!set, so dass nach Kompensation Signal symmetrisch um Null-Linie verteilt ist
Was ist eine Hüllkurve?
Was bezeichnet man als Dynamik? Eines auditiven Signals?
Verhältnis vom größten zum kleinsten Amplitudenwert
Was ist die Dynamikkompression?
Was ist eine Dynamikexpansion?
leise Stellen im Pegel herabgesenkt und laute Stellen angehoben
Was ist Flanging?
ähnlich wie Chorus, aber nur eine phasen-verschobene (verzögerte) Signalkopie
Was ist Phasing?
Kombination aus Originalsignal und variierender Phasenverschiebung einzelner Signalfrequenzen
Für was ist das AAC Profil Low Complexity?
für mittlere bis hohe Bitraten
Für was ist das AAC Profil Low Delay?
für geringe Verzögerungszeiten (20 ms) bei mittleren bis hohen Bitraten
Für welche Bitraten ist das AAC Profil High Efficiency?
für niedirge bis sehr niedrige Bitraten
Für was ist das AAC Profil SSR?
für Streaming ermöglicht ungestörte Wiedergabe von Streams durch Verringerung der Bitrate, wenn verfügbare Bandbreite plötzlich abfällt