Community
학과뉴스
학과뉴스 게시글 확인
제목 김성은 교수 연구팀 음성신호처리 분야 Top conference ‘Interspeech 2025’서 2편 논문 발표
작성자 인공지능응용학과 조회수 244 날짜 2025-09-02
첨부파일
  • 인공지능응용학과 김성은 교수 연구팀 음성신호처리 분야 Top conference ‘Interspeech 2025’서 2편 논문 발표

 

 

  •  ▲ 왼쪽부터 정승규, 임진교 석사과정
  •  

서울과학기술대학교 인공지능응용학과 김성은 교수 연구팀(https://brainailab.com)이 세계적인 음성 및 언어 기술 분야 최대 규모 학술대회인 Interspeech 2025에서 2편의 논문을 발표하며 주목을 받았다. 이번 학회는 2025년 8월 17일부터 21일까지 네덜란드 로테르담에서 개최되었으며, 구글, 메타, 아마존 등 글로벌 IT 기업들이 후원하고 전 세계 2,000여 명의 연구자가 참여하는 권위 있는 학술대회이다.

 

연구팀은 ▲ “SIDC-KWS: Efficient Spiking Inception-Dilated Conformer with Self-Attention for Keyword Spotting”“Patient-Aware Feature Alignment for Robust Lung Sound Classification: Cohesion-Separation and Global Alignment Losses” 두 편의 논문을 발표했다.

 

첫 번째 논문은 석사과정 임진교 학생의 주도로 수행된 연구로, 스파이킹 신경망(Spiking Neural Network, SNN) 기반의 인공지능 기술을 활용해 키워드 스포팅을 온디바이스 환경에서 저전력으로 구현하면서도 높은 성능을 유지하는 새로운 구조를 제안했다. 이는 차세대 음성 인식 기술의 경량화와 효율성 향상에 크게 기여할 것으로 기대된다.

 

두 번째 논문은 석사과정 정승규 학생이 주도했으며, 환자 맞춤형 특징 정렬(Patient-Aware Feature Alignment)이라는 새로운 딥러닝 학습 기법을 제안해 호흡 소리에서 이상 폐음을 정밀하게 검출할 수 있도록 했다. 이를 통해 폐질환 가능성을 보다 효과적으로 예측할 수 있는 기반을 마련했다는 점에서 의학적·산업적 파급력이 크다는 평가를 받았다.

 

김성은 교수는 “이번 연구 성과는 인공지능의 효율성과 의료적 활용 가능성을 동시에 보여주는 사례이며 국제적으로 권위 있는 학회에서 연구 결과를 인정받은 만큼, 앞으로도 인공지능 기반 음성·의료 신호 처리 분야를 선도할 수 있도록 연구를 이어가겠다”고 밝혔다.

 

목록
[01811] 서울 노원구 공릉로 232 서울과학기술대학교 상상관 419호 TEL : 02-970-9773
Copyright (c) SEOUL NATIONAL UNIVERSITY OF SCIENCE AND TECHNOLOGY. All Rights Reserved.