Top

Kỹ sư phần mềm Xử lý tiếng nói

Cập nhật:14/02/2025

Aimesoft là nơi quy tụ những chuyên gia ứng dụng AI nhằm giải quyết những vấn đề thực tiễn. Sứ mệnh của Aimesoft là đồng hành trong đời sống con người thông qua các ứng dụng trí tuệ nhân tạo đa thể thức chân thực và sống động. Tài sản lớn nhất của Aimesoft là đội ngũ hơn 30 chuyên gia và kĩ sư nghiên cứu với nền tảng lập trình vững chắc và kinh nghiệm thực chiến các dự án “khó nhằn”. Dưới dự dẫn dắt của TS. Nguyễn Tuấn Đức (CEO) và cố vấn của các chuyên gia đến từ Đại học Tokyo, Nhật Bản, Aimesoft đang có những bước chuyển mình mạnh mẽ nhằm khẳng định vị trí số 1 về cung cấp giải pháp ứng dụng Trí tuệ nhân tạo.

Aimesoft đang cần tuyển dụng vị trí Kỹ sư phần mềm Xử lý tiếng nói để :

- Nghiên cứu và phát triển các thuật toán Xử lý tiếng nói : xoá/lọc nhiễu, nhận dạng tiếng nói, tổng hợp tiếng nói, nhận diện người nói, tách tiếng (Speaker Diarization), dịch trực tiếp tiếng nói cho tiếng Nhật, Anh, Việt, Hàn.

- Xây dựng mô hình âm học (acoustic model), mô hình ngôn ngữ (language model), decoder, tối ưu hoá từ điển, ...

- Nghiên cứu và phát triển các mô hình Nhận dạng tiếng nói dựa trên neural networks

- Nghiên cứu và xây dựng các bộ cơ sở dữ liệu huấn luyện từ vựng lớn đảm bảo độ phủ về chất giọng vùng miền, độ tuổi, giới tính, môi trường... phù hợp với từng bài toán cụ thể.

- Nghiên cứu và phát triển các mô hình học máy cho Tổng hợp tiếng nói, voice clone,voice converter... dựa trên các mô hình như HMM, DNN.

Yêu cầu:

- Nắm được các kiến thức cơ bản về Xử lý tín hiệu số, cơ sở Toán học cho Xử lý tín hiệu số (Fast Fourier Transform, spectrogram, trích chọn đặc trưng tín hiệu, sử dụng bộ lọc tín hiệu, ...)

- Nắm được các kiến thức cơ bản về xây dựng các mô hình Nhận diện / Tổng hợp tiếng nói (acoustic model, language model, feature bank, ...)

- Có kiến thức cơ bản về học máy, nắm được các mô hình cơ bản thường dùng trong Xử lý tiếng nói : HMM, DNN, DTW.- Có kiến thức cơ bản về học máy với mô hình mạng nơ-ron (neural networks), các mô hình seq2seq, …

- Có kinh nghiệm sử dụng các framework/toolkit cho Nhận diện tiếng nói như : Kaldi, Sphinx, Julius, HTK ...

- Lập trình hướng đối tượng thành thạo với một trong các ngôn ngữ sau : C++/C, Python, Java

- Tiếng Anh tốt là một lợi thế

Quyền lợi :

- Thưởng Tết và lương tháng 13.

- 3 tháng review 1 lần xét duyệt thưởng/ tăng lương.

- Tham gia bảo hiểm và chương trình khám sức khỏe.

- Bạn được đảm xây dựng lộ trình phát triển sự nghiệp và kỹ năng ngay tại công ty, 3 tháng review 1 lần để cập nhật tiến độ phát triển và điều chỉnh khi cần.

- Được đào tạo, training với các khóa đào tạo miễn phí của công ty bởi các giảng viên, chuyên gia hàng đầu.

- Tham gia teambuilding, du lịch hằng năm.

- Thời gian làm việc từ thứ 2 - thứ 6 (8h30 -18h00). Không OT

Thông tin liên hệ

Email: jobs@aimesoft.com

Mobile: (+84) 985 387 426

Address: 10F, Viet A Tower, 9 Duy Tan Street, Cau Giay, Hanoi, Vietnam.

The FIRST Company to Develop Multimodal AI with 200+ Installations Worldwide

The FIRST Company to Develop Multimodal AI with 200+ Installations Worldwide

Kỹ sư phần mềm Xử lý tiếng nói