Hanwha-Vision-LOGO

Hanwha Vision SPS-A100M AI класификација на звук и детекција на насока на звук

Hanwha-Vision-SPS-A100M-AI-Класификација-на-звук-и-детекција-на-насока-на-звук-PRODUCT

Вовед

Звукот е често занемарена, но моќна алатка за надзор, меѓу невидливите закани. Додека конвенционалните системи за видео надзор се фокусираа на визуелно снимање на она што се случува, денешната безбедносна средина еволуираше за да ги препознава не само видовите звучни настани, туку и нивните точни извори. Како што се шират границите на јавната безбедност и заштитата на средствата, технологијата за аудио аналитика има потенцијал да придонесе повеќе од едноставна помош за спречување на криминал и брз одговор на инциденти.
Во овој контекст, технологијата за класификација на звук на Hanwha Vision, базирана на длабоко учење, обезбедува интелигентни функции кои прецизно препознаваат специфични аудио настани - како што се претходно обучени вресоци и кршење стакло - активирајќи непосредни предупредувања. Понатаму, технологијата за откривање на насока на звук ја идентификува локацијата на изворот на звук, доставувајќи одлучувачки информации не само за „што е звукот“, туку и за „каде потекнува звукот“. Овие две технологии работат синергистички за да ги максимизираат интегрираните можности за свесност за ситуацијата, поставувајќи нов стандард за безбедносните системи од следната генерација.
Оваа бела книга навлегува во овие технологии, обезбедувајќи практични упатства за оптимална имплементација и употреба во различни средини.

Технологија за анализа на аудио базирана на вештачка интелигенција

  1. Класификација на звуци
    Технологијата за класификација на звук на Hanwha Vision е изградена врз основа на основен модел на длабоко учење: Конволуциона невронска мрежа (CNN). Оваа технологија започнува со трансформирање на апстрактни звучни информации во визуелна форма позната како спектрограм1.
    Спектрограмот делува како акустичен „отпечаток од прст“, јасно прикажувајќи ги уникатните шеми на специфичен звук. CNN се истакнува во автоматското учење и препознавање на суптилните акустични карактеристики и шеми во рамките на овие слики од спектрограмот кои честопати се тешки за разликување од човечкото уво. Овој процес овозможува точна идентификација и класификација на широк спектар на звучни настани, вклучувајќи врескање, кршење стакло, автомобилски сирени и лизгање гуми.
    Откако ќе се детектира и класифицира звукот, системот автоматски извлекува податоци од аудио потокот. Бидејќи аудио податоците се веќе претходно обработени иampled, класифицираниот звук потоа се генерира како аудио клип file, комплетно со метаподатоци за лесно преземање и повторноview.
    Оваа технологија е достапна на одбрани производи на Hanwha Vision.
  2. Детекција на насоката на звукот
    Технологијата за детекција на насоката на звукот на Hanwha Vision поддржува брз одговор со идентификување и известување на корисниците за насоката на одреден аудио настан. Технологијата ја одредува оваа насока со мерење на временската разлика на пристигнувањето.
    (TDoA) на звучниот сигнал додека достигнува до повеќе, физички одвоени микрофони.
    Алгоритмот TDoA работи со анализа на фазната разлика во времето потребно звукот да стигне до секој микрофон, со што се проценува вистинското растојание до изворот. Оваа информација потоа се користи за пресметување на аголот на изворот на звук. Како што е илустрирано на Слика 1, систем со повеќе микрофони со микрофони (MIC1, MIC2, MIC3, MIC4) распоредени во круг може да ги одреди разликите во растојанијата (d1, d2, d3, d4) помеѓу изворот на звук и секој микрофон. Пресметувањето на временската разлика на пристигнување врз основа на овие разлики во растојанијата е јадрото на алгоритмот TDoA.

2.1. Класификација на звук Технологијата за класификација на звук на Hanwha Vision е изградена врз основа на основен модел на длабоко учење: Конволуциона невронска мрежа (CNN). Оваа технологија започнува со трансформирање на апстрактни информации за звукот во визуелна форма позната како спектрограм1. Спектрограмот делува како акустичен „отпечаток од прст“, јасно прикажувајќи ги уникатните шеми на специфичен звук. CNN се истакнува во автоматското учење и препознавање на суптилните акустични карактеристики и шеми во рамките на овие слики од спектрограмот кои честопати се тешки за разликување од човечкото уво. Овој процес овозможува точна идентификација и класификација на широк спектар на звучни настани, вклучувајќи врескање, кршење стакло, автомобилски сирени и лизгање гуми. Откако ќе се детектира и класифицира звукот, системот автоматски извлекува податоци од аудио потокот. Бидејќи аудио податоците се веќе претходно обработени иampled, класифицираниот звук потоа се генерира како аудио клип file, комплетно со метаподатоци за лесно преземање и повторноviewОваа технологија е достапна на одбрани производи на Hanwha Vision. 2.2. Детекција на насоката на звукот Технологијата за детекција на насоката на звукот на Hanwha Vision поддржува брз одговор со идентификување и известување на корисниците за насоката на одреден аудио настан. Технологијата ја одредува оваа насока со мерење на временската разлика на пристигнување (TDoA) на звучниот сигнал додека тој достигнува повеќе, физички одвоени микрофони. Алгоритмот TDoA работи со анализа на фазната разлика во времето потребно за звукот да стигне до секој микрофон, со што се проценува вистинското растојание до изворот. Оваа информација потоа се користи за пресметување на аголот на изворот на звук. Како што е илустрирано на Слика 1, систем со повеќе микрофони со микрофони (MIC1, MIC2, MIC3, MIC4) распоредени во круг може да ги одреди разликите во растојанието (d1, d2, d3, d4) помеѓу изворот на звук и секој микрофон. Пресметувањето на временската разлика на пристигнување врз основа на овие разлики во растојанието е јадрото на алгоритмот TDoA.Слика 2 визуелно ја прикажува временската разлика (τij) при пристигнувањето на звучен сигнал кај два микрофона (кафеави и сини бранови форми). Со прецизно мерење на овие временски разлики при пристигнување, системот може прецизно да ја триангулацира насоката на изворот на звук. Hanwha-Vision-SPS-A100M-AI-Класификација-на-звук-и-детекција-на-насока-на-звук (3)

Процесот на детекција на насоката на звукот е поделен на четири главни чекори:

  1. Собирање сигнали: Истовремено собирајте звучни сигнали преку повеќе микрофони.
  2. Обработка на сигнали: Анализирајте ги собраните сигнали користејќи специјализиран алгоритам.
  3. Проценка на насоката: Проценете ја насоката на звукот врз основа на обработениот сигнал.
  4. Резултат: Прикажете ја конечната детектирана насока како агол на насочување.

Оваа технологија е достапна на производите на Hanwha Vision кои поддржуваат повеќе микрофони, како што се Audio Beacon (SPS-A100M) и одредени камери опремени со Wisenet 9 SoC.

Hanwha-Vision-SPS-A100M-AI-Класификација-на-звук-и-детекција-на-насока-на-звук (4)

Инсталација и околина: Водич за оптимални перформанси

Ефективноста на решението за вештачка интелигенција за аудио на Hanwha Vision е тесно поврзана со неговата инсталациска средина. Со активно разгледување на следните точки, можете да го максимизирате потенцијалот на системот и да обезбедите стабилни перформанси.

Избор на оптимална локација за инсталација
За сигурни перформанси на класификација на звук и детекција на насока, се препорачуваат следниве услови:
Класификација на звук: Системот работи најсигурно кога растојанието помеѓу производот и изворот на звук е најмалку 2 метри. Ова растојание се базира на висината на изворот на звук. Ако растојанието е премногу блиску (во рамките на 2 метри), дури и навидум низок звук како плескање може да стане претерано гласен, што доведува до лажни позитивни резултати. Инсталацијата на таван во затворен простор е идеален метод за класификација на звук бидејќи ги минимизира акустичните рефлексии и овозможува униформно откривање на звук низ широка површина.

Hanwha-Vision-SPS-A100M-AI-Класификација-на-звук-и-детекција-на-насока-на-звук (5)Детекција на насоката на звукот: За прецизно детектирање на насоката, се препорачува минимален простор од најмалку 6.0 m ширина и 6.0 m должина. Ова ги минимизира ефектите од звучните рефлексии и реверберации и обезбедува доволен простор за анализа на сигналот помеѓу повеќе микрофони. Hanwha-Vision-SPS-A100M-AI-Класификација-на-звук-и-детекција-на-насока-на-звук (6)

Одржување на соодветно растојание и агол на пад: Растојанието и аголот помеѓу изворот на звукот на настанот и производот се критични за точноста на детекцијата. Ако аголот на пад на звукот на настанот е преголем (надминува 20°) или растојанието е прекратко, точноста на детекцијата може да се намали. Табелата подолу ги дава препорачаните минимални растојанија врз основа на висината на инсталација на производот.

Висина на инсталација на производот Минимално растојание за детекција на насока
2.3м ≥ 2.2 м
2.5м ≥ 2.7 м
2.7м ≥ 3.3 м
2.9м ≥ 3.8 м
3.1м ≥ 4.4 м
3.3м ≥ 4.9 м
3.5м ≥ 5.5 м
3.8м ≥ 6.3 м
4m ≥ 6.9 м
5m ≥ 9.6 м

Обезбедување јасен звучен пат: Физичките пречки како ѕидови, стакло или дебели завеси помеѓу изворот на звук и производот можат да го ослабнат или искриват сигналот. За да постигнете максимални перформанси, обезбедете јасен, директен пат за звукот.

Анализа на животната средина за ефикасно откривање и класификација на звук
За прецизно откривање и класификација на звук, земете ги предвид следните акустични услови и фактори на околната средина.

Тип на звук dB праг Предвидено растојание
Врескање > 70 dB 2м-20м
Кршење стакло, автомобилски сирени, лизгање гуми > 80 dB 2м-16м

За прampНа пример, звукот на врескање може прецизно да се класифицира и насочно да се детектира кога неговата јачина е над 70dB. Јачината на звукот на настанот мора да биде значително погласна од околниот шум во позадина (препорачано: најмалку 30dB погласна). За прецизно мерење и класификација, фоновиот шум идеално не треба да надминува 60dB, што обезбедува јасна разлика помеѓу бучавата од настанот и амбиенталниот шум.
Бидејќи амбиенталниот шум може да влијае на перформансите, добра практика е однапред да се анализира следново:

  • Надворешни средини: Бидете свесни за природните звуци (ветер, дожд, грмежи) и вештачките звуци (сообраќај, удари, тресење на автомобили). Во непредвидливи средини, темелна анализа може да ви помогне да ја изберете оптималната локација за инсталација.
  • Внатрешни средини: Звучните рефлексии и реверберации можат да бидат значајни во зависност од материјалите (ѕидови, тавани, подови) и големината на просторијата. Звуците што се слични на настан од цел, како што е пукање на балон или паѓање на тешка кутија, можат да создадат реверберација што доведува до лажни аларми. Инсталацијата треба да ги земе предвид акустичните својства на внатрешниот простор.

Конфигурирање на праговите за класификација на звук во dB
За да ја оптимизирате функцијата за класификација на звук, можете да го конфигурирате прагот dB за да одговара на вашата специфична околина.

  • Во бучна средина, поставете го прагот повисоко за да ги намалите лажните аларми.
  • Во тивка средина каде што настаните се суптилни, поставете го прагот понизок за да избегнете пропуштање на важни известувања.
  • По проверка на просечниот фоничен шум во dB, се препорачува да се постави праг најмалку 55 dB повисок од тој просек.

Hanwha-Vision-SPS-A100M-AI-Класификација-на-звук-и-детекција-на-насока-на-звук (7)Како што е прикажано на Слика 6, прагот на dB може да се прилагоди интуитивно со помош на лизгач или поле за внесување броеви, што директно влијае на чувствителноста на детекција во реално време. Графиконот визуелно ја претставува промената на звукот во dB со текот на времето (црна линија) и конфигурираниот праг (сива линија), што го олеснува гледањето кога звучен настан (портокалов врв) го надминува прагот.

Калибрација на насоката на звукот и конфигурација на системот
Производите на Hanwha Vision обезбедуваат настани како аудио клипови, кои вклучуваат и класификација на звук и резултати од детекција на насока.

Hanwha-Vision-SPS-A100M-AI-Класификација-на-звук-и-детекција-на-насока-на-звук (1)Како што е прикажано на Слика 7, резултатот од класификацијата на звукот се прикажува со интуитивна икона на дното, заедно со резултатот од детекцијата на насоката на звукот. „Насока (N+301.8°)“ значи дека изворот на звук се наоѓа 301.8° во насока на стрелките на часовникот од север (N).
Придружната вредност „Доверба (0.74)“ означува ниво на доверба од 74%. Ова, заедно со нивото на звучен притисок (52dB), им помага на корисниците прецизно да ја проценат ситуацијата и брзо да реагираат.
Информациите за насоката на звукот на системот може да отстапуваат од вистинскиот север со текот на времето или поради инсталацијата. Бидејќи точните информации за насоката се од суштинско значење, важно е да се калибрира референтната точка на север по потреба. Ова може да се направи со користење на еден од трите методи:

  1. Инсталирајте го производот свртен кон север, како што покажува компасот.
  2. Во менито на производот, одете до [Систем] > [Информации за производот] > [Режим на монтирање] и директно внесете го аголот измерен во насока на стрелките на часовникот од северниот дел на компасот до референтната точка на камерата.
  3. Користете ја функцијата за компас вклучена во алатката за инсталација на Wisenet за поудобно и попрецизно почетно поставување.

 Совети за сложени акустични средини

  • Комплексни акустични средини: Во средина со повеќе истовремени звуци, моделот на вештачка интелигенција може да ги класифицира како еден звук или погрешно да ги класифицира. Ова е природен феномен; сеопфатната анализа на информациите што ги дава системот ќе помогне да се обезбеди точна ситуациска свест.
    Анализа на животната средина за точни аларми: Моделот за класификација на звук може да генерира аларми за звуци кои се слични на звуците на настани, но не се во категориите на класификација - како што се триење на метални предмети, животински повици, музички инструменти или други ненадејни, моќни звуци. Разбирањето на оваа карактеристика на моделот ви овозможува да ги предвидите и подготвите алармите од овие исклучителни звуци, ефикасно намалувајќи ја непотребната забуна.

Заклучок

Со поместување над ограничувањата на визуелното набљудување, AI аудио решението на Hanwha Vision создава навистина сеопфатен систем за рано предупредување кој интелигентно го анализира звукот.
Оваа бела книга служи како практичен водич, овозможувајќи ви да ја имплементирате и оптимизирате технологијата за вашата специфична околина - од почетна инсталација до фино подесување за врвни перформанси.
Како што се развиваат безбедносните предизвици, Hanwha Vision останува посветена на унапредување на своите можности за аудио анализа, обезбедувајќи постабилно, поефикасно и проактивно безбедносно искуство во секоја ситуација.

Визија на Ханва

  • 13488 Центар за истражување и развој Ханва Вижн,
  • 6 Пангјо-ро 319-гил, Бунданг-гу, Сеонгнам-си, Ѓеонгги-до, Кореја www.HanwhaVision.com
  • Авторски права ⓒ 2025 Hanwha Vision. Сите права се задржани.

Документи / ресурси

Hanwha Vision SPS-A100M AI класификација на звук и детекција на насока на звук [pdf] Упатство за сопственикот
SPS-A100M Класификација на звук со вештачка интелигенција и детекција на насока на звук, SPS-A100M, Класификација на звук со вештачка интелигенција и детекција на насока на звук, Класификација и детекција на насока на звук, Детекција на насока на звук, Детекција на насока, Детекција

Референци

Оставете коментар

Вашата адреса за е-пошта нема да биде објавена. Задолжителните полиња се означени *