İçeriğe geç
Tüm yazılar

Ses Kaydı Deşifresinde Konuşmacı Ayrıştırma Neden Kritik?

Vedat ELEALMAK — Adli Bilişim Bilirkişisi

Konuşmacı ayrıştırma (speaker diarization), bir ses kaydındaki konuşmaların “kim, ne zaman konuştu” sorusuna göre bölütlenmesi ve her konuşma parçasının ayrı bir konuşmacı etiketiyle işaretlenmesidir. Adli deşifre bağlamında bu işlem, kayıttaki her cümlenin hangi kişiye ait olduğunun metne yansıtılması anlamına gelir. Bir ceza dosyasında “örgüt talimatı verildi” iddiasına dayanak gösterilen cümlenin sanık tarafından mı, kayıttaki üçüncü bir kişi tarafından mı söylendiği, davanın sonucunu doğrudan etkileyebilir. Bu yüzden konuşmacı ayrıştırma, deşifrenin süsü değil çekirdeğidir.

Adli dosyalarda hangi ses kayıtları deşifre edilir?

Uygulamada en sık karşılaşılan kayıt türleri şunlardır:

  • SEGBIS kayıtları: Duruşmaların Ses ve Görüntü Bilişim Sistemi ile alınan kayıtları; ifade ve beyanların tutanağa doğru geçip geçmediği tartışmalarında incelenir.
  • İletişimin denetlenmesi (telefon dinleme) kayıtları: CMK 135 kapsamında alınan kayıtların içerik dökümleri.
  • Ortam kayıtları: Taraflardan birinin aldığı ses kayıtları; aile, iş ve ceza davalarında sıkça dosyaya girer.
  • ÇİM (Çocuk İzlem Merkezi) görüşme kayıtları: Beyan içeriğinin doğru aktarımı özellikle hassastır.
  • Telefon görüşmesi kayıtları ve sesli mesajlar: Dolandırıcılık ve tehdit dosyalarında yaygındır.

Konuşmacı ayrıştırma olmadan ne olur?

Konuşmacı etiketi olmayan veya hatalı etiketlenmiş bir deşifre metninde tipik olarak üç sorun ortaya çıkar:

1. Söz sahipliği kayması. Üst üste konuşmaların olduğu bölümlerde bir kişinin sözü diğerine yazılabilir. Kavga, pazarlık veya kalabalık ortam kayıtlarında bu risk çok yüksektir; tek satırlık bir kayma bile “ikrar” veya “tehdit” niteliğindeki ifadeyi yanlış kişiye bağlayabilir.

2. Bağlam kaybı. “Evet”, “tamam”, “yaparız” gibi kısa onay ifadelerinin kime ait olduğu, hangi teklife yanıt verildiğini belirler. Etiketsiz metinde bu ifadeler bağlamsız kalır ve yorumlamaya açık hâle gelir.

3. Denetlenemezlik. Zaman damgası ve konuşmacı etiketi olmayan bir metin, kaynak kayıtla satır satır karşılaştırılamaz. Karşı taraf veya mahkeme, metnin hangi bölümünün kaydın hangi saniyesine karşılık geldiğini bulamaz; deşifrenin doğruluğu test edilemez.

Teknik olarak sağlam bir deşifre nasıl yapılır?

Güncel adli deşifre pratiğinde insan uzmanlığı ile yapay zekâ destekli araçlar birlikte kullanılır. İzlediğim süreç özetle şöyledir:

  1. Kayıt bütünlüğünün tespiti: Dosyanın hash değeri alınır; format, süre ve teknik üstveri kaydedilir.
  2. Ön iyileştirme: Gürültü azaltma ve seviye dengeleme — konuşma içeriğini değiştirmeden, yalnızca anlaşılırlığı artıracak ölçüde uygulanır ve raporda beyan edilir.
  3. Otomatik çözümleme: WhisperX tabanlı araçla kelime düzeyinde zaman damgalı transkript ve konuşmacı bölütlemesi üretilir. Hukuki terim sözlüğü, alan terimlerinin (keşif, müşteki, mütalaa gibi) doğru yazılmasını sağlar.
  4. İnsan doğrulaması: Otomatik çıktı, kayıt dinlenerek satır satır doğrulanır. Anlaşılamayan bölümler tahminle doldurulmaz; “(anlaşılamıyor, 04:12–04:15)” biçiminde açıkça işaretlenir.
  5. Raporlama: Metin; zaman damgalı, konuşmacı etiketli tablo hâlinde, kullanılan yöntem ve sınırlılıklar bölümüyle birlikte sunulur.

Burada kritik nokta şudur: otomatik araçlar hızı ve tutarlılığı sağlar, ancak nihai sorumluluk her satırı doğrulayan uzmana aittir. Tam tersi de geçerlidir; yalnızca kulakla yapılan deşifre, zaman damgası hassasiyeti ve tekrarlanabilirlik açısından denetlenmesi zor bir metin üretir.

Konuşmacı kimliklendirme ile ayrıştırma aynı şey midir?

Hayır ve bu ayrım raporlarda sık karıştırılır. Ayrıştırma (diarization), kayıttaki farklı sesleri “Konuşmacı 1, Konuşmacı 2” olarak birbirinden ayırır; kim olduklarını söylemez. Kimliklendirme (speaker identification) ise bir konuşmacının belirli bir kişi olup olmadığının incelenmesidir ve ayrı bir adli ses analizi disiplinidir. Deşifre raporunda “Konuşmacı 1’in sanık olduğu” ancak dosyadaki diğer bilgilerle (kaydı alan kişinin beyanı, isimle hitap edilmesi vb.) birlikte ve bu dayanak açıkça yazılarak ifade edilebilir.

Avukatlar için kontrol listesi

Dosyanızdaki deşifre metnini değerlendirirken şunlara bakın:

  1. Metin zaman damgalı mı? Kayıtla eşleştirilebiliyor mu?
  2. Konuşmacı etiketleri var mı; etiketlerin kişilerle eşleştirilme dayanağı yazılmış mı?
  3. Anlaşılamayan bölümler işaretlenmiş mi, yoksa metin “kesintisiz” ve şüphe uyandıracak kadar pürüzsüz mü?
  4. Üst üste konuşma bölümleri nasıl ele alınmış?
  5. Kullanılan yöntem ve varsa ses iyileştirme işlemleri beyan edilmiş mi?

Sonuç

Ses kaydı deşifresinde asıl delil değeri “ne söylendiği” ile “kimin söylediği”nin birlikte ve denetlenebilir biçimde ortaya konmasındadır. Konuşmacı ayrıştırması yapılmamış veya doğrulanmamış bir deşifre, içeriği doğru olsa bile sorgulanabilir durumdadır. Dosyanızdaki ses kaydının zaman damgalı ve konuşmacı etiketli olarak yeniden deşifresi ya da mevcut deşifrenin denetimi için iletişime geçebilirsiniz.

Dosyanızı iletin; kapsam ve süre çıkaralım.

Dava dosyanızdaki dijital delil, HTS kaydı veya ses kaydı hakkında kısa bir ön değerlendirme için iletişime geçin. İlk değerlendirme ücretsizdir ve yükümlülük doğurmaz.