ıllı Portal de Psicología y NeuroCiencias

Portal wikinfo sobre psicología y neurociencias.

 !Selecciona tu Idioma!

Enciclopedia/Diccionario de Psicología y Neurociencias:

ıllı Audición por computadora wiki: info, libros pdf y vídeos

psicologia y neurociencias

salud  Audición por computadora 


La audición por computadora o bien escucha de máquina es el campo general del estudio de algoritmos y sistemas para el comprensión del audio por las máquinas. La noción de que quiere decir que una máquina pueda conseguir “oír” es amplísima y algún tanto vaga, computer audition procura unir disciplinas que trataban inconvenientes concretos o bien fuesen concebidas para una aplicación concretamente. Los ingenieros Paris Smaragdis, entrevistados en el Technology Review, charlaron sobre estos sistemas ---“softwares que utilizan el sonido para encontrar personas en una habitación, máquinas de monitoreo para anomalías inminentes o bien activar cámaras de tráfico para grabar accidentes”.


Inspirado por los modelos de la audición humana, la audición por computadora trata con las interrogantes de la representación, transducción, agrupamiento, el empleo del conocimiento musical y la semántica general del sonido con el propósito de efectuar operaciones inteligentes sobre señales de música y audio. Técnicamente esto requiere una combinación de los métodos de campos como el procesamiento de señales, modelamiento auditivo, percepción y cognición de la música, reconocimiento de patrones y aprendizaje de máquina, asimismo los más tradicionales métodos de inteligencia artificial para la representación de conocimiento musical.


Una vez que las señales de audio son interpretadas por el sistema auditivo humano, eso complejos mecanismos perceptivos habrían de ser simulados de alguna manera por softwares para la escucha de máquina. En otras palabras, para efectuar una equivalencia con los humanos, las computadoras deberían escuchar y comprender el contenido del audio tanto como los humanos. Examinar el audio atinadamente implica campos como: ingeniería eléctrica (análisis de fantasma, filtrado, transformación de audio), inteligencia artificial (aprendizaje de máquina y clasificación de sonidos), Psicología acústica (percepción del sonido), ciencias cognitivas (neurociencia y también inteligencia artificial), acústicas (física de la producción del sonido) y música (armonía, ritmo y timbre). Además de esto, las transformaciones de audio como pitch shifting, time stretching y filtrado de objetos sonoros, habrían de ser perceptivamente y musicalmente con sentido. Para mejores resultados, estas transformaciones requieren un comprensión perceptivo de los modelos fantasmales, la extracción de peculiaridades a un alto nivel y el análisis/ síntesis del sonido. Por último, la estructuración y codificación del contenido de un fichero de audio (sonido y metadatos) podrían beneficiarse de los eficaces esquemas de compresión, los que descartan información imperceptible en el sonido. Los modelos computacionales de música y percepción de sonido y la cognición pueden dirigir a una representación más significativa, una manipulación digital más intuitiva y a la generación de sonido y música en interfaces musicales humano-máquina.


El estudio de la audición por computadora podría ser apenas dividido en los próximos sub-problemas:



  1. Representación: de señales y simbólica. Este aspecto trata con la representación frecuencia-tiempo, los dos en concepto de notas y modelos fantasmales, incluyendo el patrón playback y las texturas de audio.
  2. Extracción de características: descriptores de sonidos, segmentación, onset, tono, detección de envelope, croma y de las representaciones auditivas
  3. Estructuras de conocimiento musical: análisis de la tonalidad, el ritmo y la armonía.
  4. Similitud del sonido: métodos para la comparación entre sonidos, identificación de sonidos, detección de nuevos sonidos, segmentación y clustering.
  5. Modelación de secuencia: emparejamiento y alineación entre señales y secuencias de notas.
  6. Separación de fuente: métodos de agrupamiento de simultáneos sonidos, como detección de múltiples tonos y métodos de clustering por la frecuencia-tiempo.
  7. Cognición auditiva: modelación de emociones, anticipación y familiaridad, sorpresa auditiva y análisis de la estructura musical.
  8. Análisis multi-modal: localizar correspondencia entre señales de audio, visuales y de texto.

Problemas de representación


La audición por computadora trata con las señales de audio que pueden ser representadas en una pluralidad de formas, desde la codificación directa de audio digital en 2 o bien más canales hasta las de forma simbólica representadas instrucciones de síntesis. Las señales de audio son generalmente representadas en concepto de grabaciones digitales o bien analógicas. Las grabaciones digitales son muestras de ondas acústicas o bien factores de algoritmos de entendimiento de audio. Una de las propiedades de las señales musicales es que de forma frecuente combinan diferentes géneros de representaciones, como puntajes gráficos y secuencias de acciones de desempeño que son codificadas como ficheros MIDI.


Dado que las señales de audio comprimen múltiples fuentes de sonidos, las señales del habla que pueden eficazmente descritas en concepto de concretos modelos (como el modelo filtro-fuente), son bastante difíciles para concebir una representación paramétrica para audio por norma general. Las representaciones paramétricas de audio generalmente utilizan bancos de filtros o bien modelos sinusoidales para atrapar múltiples factores de sonidos, de vez en cuando incrementando el tamaño de la representación con la idea de apresar estructuras internas en la señal. Los modelos de datos auxiliares que son relevante para la audición por computadora son las descripciones textuales de contenidos de audio, como las anotaciones, revisiones y la información visual en el caso de las grabaciones visuales de audio.


Características


Las descripciones de los contenidos de las señales de audio generalmente requieren extracción de peculiaridades que atrapen aspectos concretos de las señales de audio. Por norma general hablando, uno podría dividir las peculiaridades de la señal o bien los descriptores matemáticos, como la energía, la descripción del fantasma, etcétera, caracterizaciones estadísticas como cambios en el sonido o bien la detección de nuevos sonidos, las representaciones singulares que se amoldan mejor a la naturaleza de las señales musicales o bien los sistemas auditivos, como el desarrollo logarítmico de la sensibilidad (bandwidth) en la frecuencia o bien la invariancia octava (chroma).


Como los modelos paramétricos de audio generalmente requieren muchos factores, las peculiaridades son utilizadas para resumir las propiedades de los múltiples factores en una más compacta o bien notable representación.


Conocimiento musical


Encontrar estructuras musicales concretas es posible utilizando el conocimiento musical como asimismo los métodos de aprendizajes de trama supervisado y no supervisado. Los ejemplos de estos incluyen detección de la tonalidad conforme a la distribución de las frecuencias que corresponden a los patrones de ocurrencia de las notas en escalas musicales, la distribución de notas en el onset para la detección de la estructura del beat, la distribución de las energías en diferentes frecuencias para advertir ecos musicales, etc.


Similitud de sonido y modelado de secuencia


La comparación entre sonidos puede ser hecha a través de la comparación de las peculiaridades con o bien sin referencia al mismo tiempo. En ciertos casos una completa semejanza puede ser calculada por los valores próximos de las peculiaridades entre 2 sonidos. En otros casos en el momento en que una estructura temporal es esencial, los métodos de deformación temporal activa han de ser aplicados para corregir las distintas escalas temporales de acontecimientos acústicos. Hallar reiteraciones y afines subsecuencias de acontecimientos sónicos es esencial para labores como síntesis de textura y también improvisación de máquinas.


Separación de fuente


Como una de las peculiaridades básicas del audio normalmente es que entiende múltiples fuentes de sonido simultáneas, como múltiples instrumentos, personas que charlan, ruidos de máquina o bien vocalización de animales, la capacidad de identificar y separar fuentes individuales es muy deseable. Desafortunadamente, no hay métodos que puedan solucionar este inconveniente de forma robusta. Los métodos existentes de separación de fuentes se fundamentan en ocasiones en la relación entre diferentes canales de audio en grabaciones multicanal. La capacidad de separar las fuentes de las señales estéreo requiere diferentes técnicas que las que se aplican frecuentemente en las comunicaciones donde hay múltiples sensores libres. Otros métodos de separación de fuentes se fundamentan en el adiestramiento o bien la agrupación de peculiaridades en la grabación mono, como el seguimiento de parciales relacionados armónicamente para la detección de tono múltiple.


Cognición auditiva


Generalmente, percibir música y audio generalmente no es una actividad dirigida por labores. Las personas gozan de la música por múltiples razones poco entendidas, que generalmente se refieren al efecto sensible de la música debido a la creación de esperanzas y su realización o bien violación. Los animales atienden los signos de riesgo en los sonidos, que pueden ser nociones concretas o bien generales de cambios sorprendentes y también inopinados. Generalmente, esto crea una situación en la que la audición por computadora no puede fundamentarse solamente en la detección de peculiaridades concretas o bien propiedades de sonido y debe plantear métodos generales de adaptación al entrecierro auditivo variable y el monitoreo de su estructura. Esto consiste en el análisis de estructuras de reiteración y auto-semejanza más grandes en el audio para advertir la innovación, como la capacidad de pronosticar la activa de peculiaridades locales.


Análisis multimodal


Entre los datos libres para describir la música, hay representaciones textuales, como notas, comentarios y críticas que describen los contenidos de audio en palabras. En otros casos, las reacciones humanas, como juicios sensibles o bien mediciones psicofisiológicas, pueden administrar una idea de los contenidos y la estructura del audio. La audición por computadora trata de hallar una relación entre estas diferentes representaciones para otorgar esta entendimiento auxiliar de los contenidos de audio.


mas informacion


  ELIGE TU TEMA DE INTERÉS: 


wiki

  PSICOLOGIA (Wikinfo) 

wiki   BUSCADOR PSICOLOGIA    

 

USUARIOS:

Hay 134 invitados y ningún miembro en línea

psicologia y neurociencias

psicologia y neurociencias

 psicologia y neurociencias

Está aquí: Inicio > [ PSICOLOGIA (WIKINFO) ] > ıllı Audición por computadora wiki: info, libros pdf y vídeos

Las cookies nos permiten ofrecer nuestros servicios. Al utilizar nuestros servicios, aceptas el uso que hacemos de las cookies. Ver políticas