M   Ü   Z   İ   K          v  e          B   İ   L   İ   M
" U l u s l a r a r a s ı   H a k e m l i   B i l i m s e l    M ü z i k   D e r g i s i
"
ISSN: 1304 - 6446 (Online)


Yarı zamanlı; Mart, Eylül
 Sayı:6  (Eylül 2006)  

 
İŞARET İŞLEME TEKNİKLERİ İLE NOTA ANALİZİ
Erinç DİKİCİ
İ.T.Ü. Telekomünikasyon Mühendisi ve Boğaziçi Üniversitesi Yüksek Lisans Öğrencisi
 

ÖZET:

Bu çalışmada işaret işleme teknikleri kullanılarak bilgisayar tarafından bir müzik eserindeki notaların tanımlanması ve tanınması için gerekli yöntemler sunulacaktır. İki bölümden oluşan çalışmanın ilk bölümünde, görüntü işleme teknikleri kullanılarak, nota kağıdına aktarılmış müzik eserinin nota analizi konusunda bir öneri getirilecektir. İkinci bölümde ise dinlenebilir formattaki bir müzik dosyasının nota bilgilerinin ses işleme tekniği ile belirlenmesi konusunda yaklaşımlar yapılacaktır.


Gerek görüntü, gerekse ses işleme metodları kullanılarak bilgisayar tarafından otomatik olarak elde edilen nota özellikleri hakkındaki bilgi, eserin melodik kimliği ile ilgili özet bir yapı ortaya koymaktadır. Bu yapıyı kullanarak nota kağıdı bilinen bir eseri bilgisayar yardımıyla sese dönüştürmek (çaldırmak), ses biçimiyle ele alınan eserin de nota kağıdını otomatik olarak oluşturabilmek olanaklıdır. Ayrıca, söz konusu eserin melodik yapısıyla ilgili istatistiksel bilgilere ulaşılabilir. Tüm bunlar, elektronik bir müzik arşivinin oluşturulması konusunda da atılması gereken ilk adım olarak değerlendirilmelidir.

 

 

 Anahtar Kelimeler:  
İşaret İşleme - Görüntü İşleme - Ses İşleme - Nota Analizi
 


GİRİŞ

            İşaret işleme, Telekomünikasyon Mühendisliği alanında yer alan bir araştırma ve uygulama dalıdır. “İşaret” sözcüğü, bir sistemin davranışına ya da durumuna ilişkin bilgi taşıyan büyüklüklere verilen addır ve “sinyal” sözcüğü ile eş anlamlı olarak kullanılmaktadır (Kayran, 2004:2). Bu kavram çerçevesinde yazı, resim gibi bileşenler (kavramlar) görsel işaretler; müzik ve konuşma gibi bileşenler de ses işaretleri olarak nitelendirilebilir. Görüntü ve ses işleme, işaret işlemenin özelleşmiş iki alt konusunu oluşturur.

            Çalışmanın konusu, bir müzik eserinin melodik bilgisinin, işaret işleme metodları kullanılarak bilgisayar tarafından elde edilmesidir. Bunun için öncelikle ele alınan eserdeki notaların tanımlanması (diğer müzikal öğelerden ayırt edilebilecek duruma getirilmesi), sonra da bu notaların tanınması (özelliklerinin belirlenmesi) gerekmektedir. Çalışma iki ayrı başlık altında sunulacaktır: İlk bölüm görüntü işleme teknikleri kullanılarak, nota kağıdına aktarılmış bir müzik eserinin; ikinci bölüm ise ses işleme teknikleri kullanılarak ses formatındaki bir müzik dosyasının müzikal bilgilerine ulaşılması için gerekli yöntemleri içermektedir.

 

YÖNTEMLER VE UYGULAMA

 1. Görüntü İşleme Tekniği ile Nota Kağıdından Nota Analizi

 

Önbilgi

Temel amaç, sayısal formatta kaydedilmiş bir nota kağıdı görüntüsündeki notaların konumlarının ve özelliklerinin (ton ve vuruş -uzunluk- değerlerinin) belirlenerek bu bilginin matematiksel yapıda ve toplu bir biçimde ifade edilmesidir. Eser hakkında özet niteliğindeki bu bilgi kullanılarak parça ile ilgili istatistiksel bilgiler derlenebilmekte ve melodi, bilgisayar tarafından otomatik olarak çaldırılabilmektedir.

            Bahsedilen tüm işlemler bilgisayarda mühendislik hesaplamaları için geliştirilmiş özel bir programlama yazılımı olan MATLAB üzerinde gerçekleştirilmektedir. Bu sebeple, kullanılan yöntemin anlaşılmasını kolaylaştırmak için bu aşamada kısaca sayısal görüntü biçimi konusunda bilgi sunmak uygun olur.

            Bilgisayar gibi elektronik ortam cihazları tarafından tanımlanabilen görüntü dosyalarına “sayısal görüntü” adı verilir. Sayısal bir görüntü, “piksel” adı verilen ve her biri tek bir renk tonunu barındıran küçük elemanlardan meydana gelir. Pikseller, koordinat düzleminde yatay ve düşey şekilde sıralanarak sayısal görüntüyü oluşturur. Bilgisayar ekranındaki bir resim fazla yakınlaştırıldığında (büyütüldüğünde), resmi oluşturan pikseller, küçük kareler şeklinde görülebilir. Bir nota görüntüsü ve bu görüntünün bir kısmının büyütülmüş durumu Şekil 1’de gösterilmektedir.                   

Resim yakınlaştırıldığında görülebilen piksellerin resim dosyası üzerindeki konumları birer satır ve sütun numarası ile tanımlanabilir. Matematiksel dilde satır ve sütunlardan oluşmuş böyle bir yapıya “matris” adı verilmektedir (Digital Image Processing, 2002:55).

Şekil 1.  Dörtlük bir nota ve görüntü büyütüldüğünde ortaya çıkan piksel yerleşimleri

 

            Her bir pikselin taşıdığı renk tonu, elektronik cihaz üreticileri tarafından ortaklaşa kararlaştırılmış bir sayı kodu ile belirtilir. Yalnızca siyah ve beyaz tonlardan oluşan bir görüntüde siyah ton “0”, beyaz ton ise “1” rakamı ile gösterilir. Bu tip görüntülere yalnızca iki ton barındırdıklarından, “ikili görüntü” adı verilmektedir. Nota kağıdına aktarılmış bir müzik eserinde, yazım renginin bir önemi olmadığından, çalışmada ikili formattaki nota kağıdı görüntüleri kullanılmıştır.

 

Notaların Belirlenmesi

Görüntü işleme açısından notanın tonunun ve uzunluğunun belirlenmesi işlemi sırasıyla, notanın porte üzerindeki yerinin ve nota yuvarlağının dolu olup olmadığı, yanında uzatma noktası veya kuyruğu bulunup bulunmadığı gibi bilgilerin edinilmesine karşılık gelmektedir. İşlemin adımları, örnek olarak Şekil 2 üzerinde gerçeklenecektir.

 

Şekil 2 Örnek nota kağıdı görüntüsü

 

            Böyle bir görüntü (Şekil 2) müzik eğitimi almış kişiler için bir anlam ifade etse de, bilgisayar için 0 ve 1’lerden oluşmuş piksellerden (matris hücrelerinden) başka bir anlam taşımamaktadır. “Nota” kavramını bilgisayara anlatmak mümkün olmadığından, yalnızca renk tonundaki zıtlıklardan ve notasyon ile nota kağıdı oluşturma geleneğinin sağladığı olanaklardan yararlanarak nota yerleri bulunmaya çalışılacaktır.

Nota yerlerinin (koordinatlarının) tanımlanabilmesi için öncelikle porte çizgilerinin bilgisayar tarafından öğrenilmesi gereklidir. Bu amaçla görüntü tepeden aşağı, satır satır taranır. Bir satır boyunca siyah ton (piksel) yoğunluğunun önceden tanımlı bir eşik değerden daha yüksek olması durumunda, bu satır bir porte çizgisi olduğu yönünde bir etiket ile belirlenir. Nota kağıtlarıyla yapılan denemeler ile bu yoğunluk sınırının, tüm satırın %70’i olarak alınmasının uygun olduğu görülmüştür. Bu işlem sonucunda hem işaretli (etiketli) satırların ana resmin kaçıncı satırları olduğunu belirten bir çıktı, hem de yalnızca portenin görülebildiği bir resim elde edilebilir (Şekil 3).

Şekil 3 Şekil 2’de portenin belirlenmesi ile elde edilen görüntü

 

 

            Gerçekte bir nota kağıdında yalnızca tek bir portenin bulunmayacağı açıktır. Böyle bir durumda görüntü baştan aşağı taranarak her beş porte çizgisinden sonra yeni bir portenin geleceği varsayılabilir ve bu sayede ilerideki adımlar, her bir porte parçası üzerinde tekrarlanabilir.

            Aranan bilgi, yalnızca notalar tarafından taşınmaktadır. Dolayısıyla notaların tanımlanabilirliğini artırmak üzere görüntüdeki diğer elemanlar silinebilir. Sayısal bir görüntü yalnızca rakamlar içeren bir matris yapısında olduğundan, bu matrisin hücreleri arasında toplama, çıkarma gibi matematiksel ve ‘VE’, ‘VEYA’, ‘DEĞİL’ gibi mantıksal işlemler yürütülebilir. Örneğin, orijinal resim (Şekil 2) ile yalnızca porteyi içeren resmin (Şekil 3) mantıksal olarak karşılaştırılması sonucu, portenin görüntüden silindiği resim elde edilmektedir (Şekil 4).

 

Şekil 4 Portesi silinmiş nota kağıdı görüntüsü

 

            Aynı yöntem, elde edilen bu görüntüdeki ölçü çizgileri ve nota çizgileri gibi düşey çizgileri elemek için de kullanılır. Bu kez, yan yana sıralanmış her bir sütun üzerinde siyah piksel yoğunluğunun %85’i geçmesi durumunda, sütun silinmek üzere markalanır. Sonuçta oluşan durum Şekil 5’teki gibidir.

 

Şekil 5 Düşey çizgilerin de elenmesi sonucu oluşan görüntü

 

            Belirtilen koşul sağlandığından, sol anahtarının da büyük bir kısmı görüntüden silinmiştir. Ancak anahtar ve hemen yanındaki ölçü işareti bu işlem sonucu tamamıyla yok edilememiştir (Şekil 5). Nota kağıdındaki her portede bu elemanların bulunduğu düşünülecek olursa, bunların göz ardı edilerek yalnızca notaların resimde görüneceği bir sol-sınır (sütun) bulunabilir. Çeşitli nota kağıtlarıyla yapılan denemeler notaların, resmin tüm sütunlarına oranla %8’inden önce başlamadığını, dolayısıyla görüntünün buraya kadar olan kısmının ihmal edilebileceğini göstermiştir. Böyle bir yöntem izlendiğinde, yalnızca ilgilenilen elemanların (nota, nokta ve kuyrukların) bulunduğu Şekil 6 elde edilmektedir.

Şekil 6 Yalnızca ilgilenilen elemanların bulunduğu görüntü biçimi

 

            Bu aşamadan sonra istenen, her nota yuvarlağının tek tek konumlarının bulunmasıdır. Ancak bunun için, notayı ortadan bölen (porte çizgisinin çıkarılmasıyla oluşan) beyaz çizgilerin ve notalara ait nokta ve kuyrukların göz ardı edilmesi gerekmektedir. Bu amaçla, elde edilen şekil üzerine çeşitli morfolojik yöntemler uygulanır.

Sayısal görüntü işlemede morfolojik yöntemler, söz konusu resmin genel yapısını bozmadan şekilsel bir takım düzeltmeler yapmak üzere kullanılan genişletme, daraltma, budama gibi işlemlerden oluşur (Digital Image Processing, 2002: 519). Morfolojik düzeltmeler sonucunda, Şekil 7’de gösterildiği gibi nota yerlerinin belirlenmesi için istenen görüntü düzenine ulaşılır.

Şekil 7 Morfolojik düzeltmeler sonucu ulaşılan nota görüntüsü

 

            Görüldüğü gibi Şekil 7’deki resimde her bir nota yuvarlağı aslında onlarca pikselin bir araya gelmesiyle oluşmaktadır. Bu piksellerin koordinatlarının ortalama değerleri alınarak, her bağımsız nota yuvarlağının tek bir piksel koordinatı, başka bir deyişle (satır,sütun) ikilisi ile belirlenmesi sağlanır. Bu (satır,sütun) ikilileri bir tablo şeklinde kaydedilir.

            Notaların ton bilgisine ulaşmak amacıyla, her bir nota için kaydedilen piksel koordinatı, porte çizgilerinin daha önceden çıkartılmış bulunan koordinatlarıyla karşılaştırılır ve notanın, hangi çizginin üzerinde ya da hangilerinin arasında bulunduğu tespit edilir. Böylece elde edilen ton bilgisi, matematiksel bir kod ile hazırlanan tabloya yeni bir sütun oluşturacak biçimde eklenir.

 

Nota Uzunluklarının Belirlenmesi

            Notaların uzunluk değeri birçok eleman tarafından ortaklaşa belirlendiğinden, doğru bilgiyi tek bir aşamada elde etmek olası değildir. Bu nedenle önce, nota yuvarlaklarının içinin dolu olup olmadığına bakılır. Her bir notanın koordinatını belirleyen pikselin çevresindeki 3x3 piksellik bölgede siyah yoğunluğu %50’nin altında kalıyor ise, bu nota içi boş (2 vuruşluk) bir nota olarak değerlendirilir. Aksi takdirde, notanın 1 vuruşluk ya da daha düşük değerde (uzunlukta) bir nota olduğu belirlenir.

            Bundan sonraki aşamalar ise notanın yanında nokta ve sapında kuyruk olup olmadığının araştırılmasını kapsar. Nokta araştırması için, öncelikle notanın görüntüsünün en sağ uç noktası (pikseli) işaretlenir. Bu noktadan sağa doğru küçük bir alanda (denemeler 5x4’lük bir alanın yeterli büyüklükte olduğunu göstermektedir) noktayı belirten bir siyah piksel bulunup bulunmadığı araştırılır. Eğer notanın yanında nokta olduğu tespit edilirse, notanın önceden belirlenmiş uzunluk değeri 1.5 katına çıkarılır.

            Nota sapında kuyruk bulunup bulunmadığıyla ilgili araştırma da benzer biçimde yapılabilir. Notanın çiziliş biçimine uygun olarak, sağ-üst veya sol-alt yakınlığında bir siyah piksel varlığı, nota kuyruğunu belirtecektir. Bu durumda notanın önceden belirlenmiş uzunluğu yarıya düşürülür. Notanın hem kuyruğu, hem de noktası olma durumunda öncelikle kuyruk tarafından belirlenen süre düzeltmesi değerlendirilir.

 

Elde Edilen Verilerin Kullanılması

            Tüm bu işlemler sonucunda notanın ton ve uzunluk (vuruş) değerleri belirlenmiş olur. Bu bilgiler son halini alan bir tabloda saklanır (Tablo1). Artık yalnızca matematiksel ifadeden oluşmuş bu tabloyu kullanılarak eser hakkında nota analizi yapmak olanaklıdır. Örneğin, tonlarına göre nota dağılımı ya da eserde daha çok kaç vuruşluk notaların yer aldığı bilgilerine kolaylıkla ulaşılabilir. Ayrıca, yine bu tablodaki bilgiler kullanılarak nota analizi yapılan eserin bilgisayar tarafından çaldırılması da sağlanabilir.[1]

 

Tablo . Örnek parça için nota ton ve vuruş değerlerini içeren tablo

Sıra

Nota Ton

Nota Vuruş

1

Mi

1

2

Mi

1

3

Fa

1

...

...

...

13

Mi

1.5

14

Re

0.5

15

Re

2

 

 

2. Ses İşleme Tekniği ile Müzik Dosyasından Nota Analizi

 

Önbilgi

            Bu bölümde ses işleme tekniği kullanılarak, dinlenebilir formattaki bir müzik dosyasında seslendirilen eserin nota analizi için bir yöntem sunulacaktır. Burada öncelikle, sesin dalga yapısının işaret işleme açısından önem taşıyan kısmı ile ilgili kısaca bilgi verilecektir.

            Bilindiği gibi her ses, genliği sesin şiddeti, frekansı ise sesin tonu ile belirlenen bir dalga biçimi oluşturur. Bilgisayar tarafından oluşturulan tek frekanslı sesler, tek bir sinüs dalgası biçiminde ifade edilebilir. Doğal sesler (insan sesi, enstrüman sesi gibi) ise bundan çok daha karmaşık yapıdadır ve geniş bir frekans bandına yayılmıştır. Ancak karmaşık yapılı olsalar dahi tüm sesler, belirli frekanslara sahip sinüsoidlerin (sinüs benzeri dalga biçimlerinin) süperpozisyonu (belirli ağırlıklarla çarpılarak toplanmış kombinasyonları) biçiminde ifade edilebilir (Signals and Systems, 2003: 195).

Bir ses işaretini oluşturan frekansların görülmesi için bu işaretin frekans spektrumu incelenebilir. Frekans spektrumu kabaca, işaret içinde hangi frekanslardan ne ağırlıkta bulunduğunu gösteren bir grafiktir. Dolayısıyla eğer enstrüman seslerinde olduğu gibi çalınan notada baskın bir frekans mevcut ise bu, frekans spektrumunda kendini yüksek ağırlıklı (genlikli) bir tepecik olarak gösterir.

Her nota, belirli bir frekans bandı içerisinde anlam taşır ve bu frekans bandının orta noktasındaki değer, o notanın merkez frekansı olarak adlandırılır. Frekans bandlarının notalarla ilişkilendirilmesi ise farklı biçimlerde olabilmektedir. Evrensel olarak kabul edilmiş bulunan “Tampere Sistem”de her ses tonu bir öncekini, öncekinin frekansının 21/12 = 1.059 katı kadar bir frekansla takip etmektedir. Bu şekilde sıralanan 12 ses tonu bir oktav oluşturur, dolayısıyla her oktavın başlangıç tonu, bir önceki oktavın başlangıç tonunun tam iki katı frekansındadır. Temel olarak insan kulağının algılayabileceği seviyede en düşük frekanslı (en kalın) ton, 55.00 Hz’lik temel frekansa sahip A1 notasıdır. Oktav değişimleri ise, A2 = 110.00 Hz, A3 = 220.00 Hz örneğinde olduğu üzere, nota yanındaki rakamın değişimi ile sembolize edilir.

 

 

Notaların Belirlenmesi

Birinci bölümde olduğu gibi bu bölümde de, ilgilenilen ses dosyasının melodik özelliklerinin belirlenebilmesi için nota tonlarının ve uzunluklarının ayrı ayrı belirlenmesi gerekmektedir. Nota tonları, her bir notanın frekans bilgisi kullanılarak, nota uzunlukları ise bir zaman ölçeğinde her bir notanın bağıl (birbirlerine oranla) uzunlukları belirlenerek çıkarılacaktır.

Asıl inceleme konusu olan nota özelliklerinin tanımlanabilmesi için, öncelikle ses dosyasının, her biri tek bir notayı içeren parçalara bölünmesi gerekmektedir. Bu da, notaların ses dosyasında başlangıç ve bitiş noktalarının (anlarının) belirlenmesi problemini beraberinde getirmektedir. Bu işleme kısaca, “başlangıç yeri tespiti” adı verilir (On the computer recognition of solo piano music: 2). Bu tespit çalışmanın en önemli aşamasını teşkil etmektedir. Bu aşama doğru yapıldığı takdirde bundan sonraki tüm işlemlerin minimum (%5’in altında) hata payı ile yürütülebildiği görülmüştür.

Çalışma, Şekil 8’de zaman grafiği verilen ses dosyası üzerinde aktarılacaktır. Bu dosyada, bir çıkış-iniş Do Majör dizisi seslendirilmektedir.

Şekil 8 Ses işleme tekniği için örnek ses dosyasının dalga biçimi

 

Yüksek genlikler (tepecikler) ile belirlenen nota başlangıç anları yalnızca grafiğin incelenmesi ile insan gözü tarafından kolaylıkla tespit edilebilmektedir. Örnek olarak sunulan grafikte de (Şekil 8) her bir notanın başlangıcı ani yükselen genlik seviyesi ile ayırt edilebilmekte ve nota dalga biçiminin mutlak genliğinin (başka bir deyişle salınım şiddetinin), diğer notanın başlangıcına kadar düşmekte olduğu gözlenmektedir.

            Ancak aynı tespitin bilgisayar tarafından otomatik olarak yapılması istendiğinde, durum aynı derecede basit değildir. Grafiğe yakından bakılacak olursa belirli bir nota içinde genlik dağılımının düzgün azalan biçimde olmadığı, tek bir notanın dalga biçiminde dahi ani sıçrama noktalarının bulunduğu görülecektir. Bilgisayarın bu değerleri bir nota başlangıcı olarak adlandırmaması için çeşitli istatistiksel tanımlamaların ve bazı fiziksel kıstasların programa “öğretilmesi” gerekmektedir. Söz konusu problemin çözümü için kullanılan algoritma aşağıdaki gibidir:

·        Öncelikle, mutlak işaretin (tamamı pozitif değerlerden oluşan işaretin) ortalama değeri ve standart sapması hesaplanır. Ortalama, işaretin en olası genlik değerini belirtirken standart sapma, değerlerin ortalamadan ne ölçüde saptıkları konusunda bir referans bilgi oluşturmaktadır.

·        Ardından, işaretin dalga biçimi üzerinde, ortalamadan en az dört standart sapma kadar farklılık gösteren noktalar bulunup işaretlenir. Bu durum, grafikte yalnızca ani genlik sıçramalarının olduğu bölgelerin (tepe bölgelerinin – nota başlangıç bölgelerinin) ön plana çıkarılmasına yardımcı olmaktadır. Böylece işaretlenmiş noktalardan oluşan bir grafik izlenebilir (Şekil 9).

Şekil 9 Ortalamadan dört standart sapma kadar farklı olan tepe değerleri

 

·        Bu koşulu sağlayan noktalar tepe noktalarının yeri konusunda oldukça iyi bir yaklaşım sergilemekle birlikte, her bir tepe (nota) için tek bir işaretlenmiş nokta bulmak mümkün olmamaktadır. Bu durumda bilgisayarın hesaplamalarına fiziksel gerçeklenebilirlik ile ilgili bir kısıt getirmek gereklidir: “Çalınan iki notanın başlangıçları arasındaki sürenin, saniyenin üçte birinden az olması fiziksel olarak gerçekleşmesi zor bir durumdur.” İşte bu kısıt koşul algoritmaya dahil edildiğinde ve koşulu sağlamayan noktaların işaretlerinin kaldırılması istendiğinde, her bir nota başlangıcı için tam olarak bir tepe noktası işaretlenmiş olmaktadır (Şekil 10). Ayrıca, parçanın bitişini sembolize edecek şekilde en sona da bir işaret yerleştirilmelidir:

Şekil 10 Her nota başlangıcı için tek işaretlenmiş nokta içeren grafik

           

            Böylece notaların başlangıç noktaları hatasız olarak işaretlenmiştir. Her bir notanın birbirini aralıksız (durak olmaksızın) takip ettiği göz önüne alınacak olursa, bir nota uzunluğunun işaretli bir noktadan sıradakine kadar olduğu varsayılabilir. Böylece sıra, notaların hangi tonda olduklarını belirlemeye gelmiştir.

Bu işlem için, işaretli iki nokta arasındaki bölgede bulunan dalga biçiminin frekans spektrumu incelenir. Burada notanın merkez frekansı çok belirgin biçimde elde edilememekle birlikte, çeşitli yaklaşımlar kullanılarak ilgilenilen aralıkta hangi frekansın (ses tonunun) baskın olarak bulunduğu belirlenebilmektedir. Her bir nota için belirlenen bu değerler bir tabloya sırasıyla kaydedilir.

 

Nota Uzunluklarının Belirlenmesi

            Nota başlangıç yerleri ve notaların birbirlerini aralıksız takip ettiği bilgisini kullanarak, iki nota başlangıcı arasındaki zaman farkından, her bir notanın ne kadar süre ile (kaç saniye) çalındığını belirlemek olanaklıdır. Ancak, müziği okuyan kişi açısından önemli olan notanın süre cinsinden değil, vuruş cinsinden uzunluğudur.

Nota uzunluklarının (vuruşlarının) belirlenmesi konusundaki en önemli problem, eserdeki nota tipleri ile ilgili sisteme bir ön bilgi verilmemiş olmasıdır. Aynı müzik eserinde çalınan benzer notaların uzunlukları, kullanılan enstrümana, seçilen tempoya ve hatta çalan kişinin tarzına bağlı olarak değişkenlik gösterebilmektedir. Üstelik, çalış esnasında aynı vuruşa sahip iki notanın da bire bir eşit sürelerle çalınması olanaklı değildir.

Bu durum, yine birtakım varsayımlar yaparak sisteme bazı kısıtlamalar getirmeyi gerektirmektedir. Bu amaçla öncelikle, ilgilenilen eserin yalnızca 8’lik, 4’lük, 2’lik notalar ile bunların tek kuyruklu ve tek noktalı versiyonlarından oluştuğu varsayılacaktır (Varsayım, sonraki işlemlerin basitleştirilmesi amacıyla yapılmaktadır, teoride tüm vuruş çeşitlerinin kapsanması söz konusudur). Ayrıca, nota sürelerinden vuruş sayılarına sağlıklı bir dönüşüm yapabilmek amacıyla, bir referans nota uzunluğu seçilmelidir. Böylece diğer notaların vuruşları, bu referans notanın vuruşu ile karşılaştırılarak belirlenebilir. Yine basitlik amacıyla, bu referans nota, parçada en çok kullanılmış nota olacak biçimde seçilebilir.

 

Nota vuruşlarının tespiti için kullanılan algoritma da şu adımlardan oluşmaktadır:

·        Öncelikle, tüm notalar süre bakımından kısadan uzuna olacak şekilde sıralanır. Daha önce belirtildiği gibi, nota başlangıçlarının kesin tespit edilememesi olasılığı ve müzisyenin benzer vuruşlu notaları tam olarak eşit süreler ile çalamayacağı gerçeğinden hareketle, notaların süre bakımından gruplandırılması gerekmektedir.

·        Sıraya dizilmiş bu notalara bakıldığında, vuruş bakımından farklı, ardışıl iki notanın arasındaki süre farkının en az 1.5 olması gerektiği açıktır. Bu iki orandan başka bir olasılık söz konusu olmadığından, uzunluk bakımından birbirlerine oranı 1.25’in altında olan ardışıl her iki nota, aynı grupta olacak şekilde sınıflandırılabilir. Bir sonraki aşamada bu grubun en düşük süreli elemanı referans olarak alınır ve işlemlere devam edilerek gruplar oluşturulur.

·        Verilen örnekte, parçada en çok 1 vuruşluk (dörtlük) notalar bulunmaktadır. Bu durumda dörtlük notalar çok yüksek olasılıkla uzunluklarına göre sıralanmış dizinin ortasında yer alacaktır. Dolayısıyla, dizinin tam ortasında yer alan nota, referans nota olarak belirlenmektedir. Varsa, önceden gruplanmış diğer notalar da bu referans büyüklüğe oranlanarak 8’lik notalar, 2’lik notalar, vb. şekilde etiketlendirilir.

Belirlenen nota uzunluklarının parçanın temposuna uygun olmadığı düşünülecek olursa sonradan tüm notaların vuruş sayısı belirli bir tamsayı ile çarpılıp bölünerek düzenleme yapılabilir.

Böylece elde edilen notaların vuruş bilgisi, nota tonlarının bulunduğu tablonun yanına eklenir. Son halini alan bu tablo, eserdeki tüm notaların, dolayısıyla eserin kendisinin bilgisayar için ileri düzey hesaplamalara uygun bir özet bilgisini taşımaktadır. Örnek parça için çıkartılan tablo, Tablo2’de sunulmaktadır:

 

Tablo 2. Örnek parça için nota ton ve vuruş bilgisini içeren tablo

Sıra

1

2

3

...

7

8

9

...

15

16

17

Nota Ton

C4

D4

E4

...

B5

C5

B5

...

C4

B4

C4

Nota Vuruş

1

1

1

...

1

1

1

...

1

1

3

 

 

Elde Edilen Verilerin Kullanılması

            Görüntü işleme ile nota analizinde elde edilen sonuç tablosu, notaların bilgisayar yardımıyla seslendirilmesi için kullanılmıştır. Ses işleme tekniği ile elde edilen sonuçlar da bilgisayar tarafından otomatik olarak eserin nota kağıdının hazırlanması için kullanılabilir. Önceden hazırlanmış nota, porte, anahtar gibi müzik elemanlarının resim formatındaki şablonları, tablodan edinilen bilgiler doğrultusunda bir araya getirilerek nota kağıdının oluşturulması sağlanabilmektedir. Örnek ses dosyası için hazırlanan programın çalıştırılmasıyla, Şekil 11’deki görüntü oluşturulmuştur.

Şekil 11. Örnek ses dosyası için oluşturulan nota kağıdı görüntüsü

 

            Günümüzde internet bağlantı ve veri aktarım hızlarının giderek artmasına karşın, bilgisayarlar arasında büyük boyutlu müzik dosyalarının aktarımı sırasında halen uzun süreler beklemek gerekebilmektedir. Elde edilen sonuçlar, eseri dinlemek yerine yalnızca hakkında genel bir fikir edinmek isteyen bilgisayar kullanıcıları için de oldukça kullanışlı olabilecektir: Notalar hakkındaki özet bilgi, eserin ses formatındaki bütününe oranla çok daha az yer kaplamakta ve aktarımı çok daha hızlı biçimde yapılabilmektedir. Alıcı kişi, bu bilgiyi kullanarak kendi bilgisayarında eserin otomatik olarak seslendirilmesini sağlayabilir ve bu sayede melodiyi dinleyebilir.

            Bu amaçla düşünülmüş iki farklı yöntem bulunmaktadır: Birincisi, ses sentezi ile, seslerin tamamıyla bilgisayar tarafından otomatik ve anlık olarak üretilmelerini sağlamaktır. Bu yöntemin en basit hali, görüntü işleme ile nota analizi bölümünün sonunda kısaca belirtilen, her tonun birer sinüs dalgası ile sembolize edilerek çaldırılması durumudur. Ancak günümüzde çok daha gelişmiş ses sentezi teknikleriyle, birçok müzik enstrümanının sesi yüksek başarıyla taklit edilebilmektedir.

            Daha az bilişsel emek gerektiren bir başka yöntem ise, dinlenilmesi istenen enstrüman seslerinden kayıt alarak her nota (ton) için ses örnekleri toplamaktır. Bu ses örnekleri, tabloda yazılı olan bilgiler kullanılarak art arda eklenebilir ve böylece melodi, istenen enstrüman ya da enstrüman kombinasyonu ile dinlenebilir.

            Proje çalışması sırasında ikinci yöntemi test etmek üzere, İTÜ Türk Musikîsi Devlet Konservatuvarı’nda çeşitli enstrümanlardan ses (nota) örnekleri toplanmıştır. Bir veritabanına kaydedilen bu ses örnekleri, farklı nota tabloları ile denenmiş ve yöntemin -eser hakkında genel bir bilgi edinmeye yetecek düzeyde- oldukça başarılı biçimde çalıştığı gözlenmiştir.

 

SONUÇLAR VE TARTIŞMA

 

1. Bölümün Sonuçları:

1a. Çalışmada, nota kağıdının görüntü işleme tekniği ile analizi için işlemsel açıdan basit bir yöntem önerilmektedir. MATLAB dili kullanılarak hazırlanan programda W.A. Mozart’ın “9. Senfoni” ve J.S. Bach’ın “Minuet in G” eserlerinden kısa parçalar denenmiş ve nota tanımada %95’lere varan başarı elde edilmiştir.

1b. Yöntemin bu üstün başarısına rağmen, deney konusu parçaların müzikal uzmanlık bakımından oldukça basit olduğu söylenebilir. Aktarılan metod yalnızca notaların tespiti için sonuç vermekte, nota kağıdında yer alan anahtar, ölçü, diyez, bemol ve duraklama işaretleri gibi diğer birçok öğeyi göz ardı etmektedir. Ancak, nokta ve kuyruk tespitleri için kullanılan yöntemlerin benzerlerinin, bu öğeleri de tespit edecek biçimde uyarlanması mümkündür.

1c. Nota yerleşimlerinin doğru tespitini sağlayan sistem parametre değerlerinin yalnızca kısıtlı sayıdaki matbaa baskısı nota kağıtlarında denendiği ve el yazısı veya standart dışı müzik notasyonlarında aktarılan yöntemin kesin sonuç vermeyebileceği unutulmamalıdır.

 

2. Bölümün Sonuçları:

2a. MATLAB ile hazırlanmış olan nota analiz programı, denenen birçok örnek ses dosyasındaki notaları doğru biçimde tanımlayabilmiş ve bu açıdan oldukça başarılı sonuçlar elde edilmiştir. Notaların başlangıç ve bitiş noktalarının tam olarak belirlenmesi işleminin, sistemin toplam başarımını etkileyen en önemli adım olduğu açıktır.

2b. Programın testi sırasında küçük bir bölüm ses dosyasında ise kısmen, notaların eksik ya da hatalı tespit edilebildiği gözlenmiştir. Bu durumun başlıca iki sebebi olduğu görülmüştür:

·        Özellikle yüksek tempolu müziklerde kimi notalar henüz doğal ses zayıflamasını tamamlamadan bir diğer nota çalınmakta ve bu durum nota başlangıç yerlerinin tespiti için kullanılan algoritmanın yetersiz kalmasına sebep olmaktadır. Parça temposuna uygun adaptif bir düzenlemeyle bu sorunun üzerinden gelinebileceği düşünülmektedir.

·        Notaların tespiti için kullanılan kimi ses dosyalarında kayıt ortamından kaynaklanan gürültü (istenmeyen sesler), notaların tespitini zorlaştırmaktadır. Ayrıca, bazı enstrümanların dalga biçimlerinde, notanın kendi frekansından çok, harmoniklerinin frekansı baskın olarak görülebilmektedir. Bu gibi bir durumda nota isminin doğru tespit edildiği, ancak bir oktav incesi olacak biçimde yanlış tanımlandığı belirlenmiştir.

2c. Çalışma, yalnızca basit (tek enstrümanla çalınmış ve her seferinde yalnızca tek bir notanın bulunduğu) müzik eserlerinin nota analizinin yapılabilmesi için yöntem önerilerini içermektedir. Profesyonel düzeydeki müzik eserlerinin analizi için temeli aynı olan bu yöntemler üzerinde çeşitli düzenlemeler yapılması gerekliliği ortadadır.

 

 

TEŞEKKÜR

 

Bu çalışma, İTÜ Elektrik-Elektronik Fakültesi Telekomünikasyon Mühendisliği Lisans Programı süresince verilmekte olan “Görüntü İşleme Temelleri” ve “Çokluortama Giriş” derslerinin dönem projeleri olarak hazırlanmıştır.

            Proje çalışmalarımı müzik tekniği üzerinde yapmama olanak sağlayan ve bu konuda destek olan hocam Sayın Doç. Dr. Işıl CELASUN’a teşekkür ederim. Ayrıca, bu çalışmaya en başından itibaren yakın ilgi göstererek destek veren, enstrümanlardan ses örnekleri toplanması aşaması da dahil her konuda katkılarını esirgemeyen                 Sayın Yrd. Doç. Gülay KARAMAHMUTOĞLU’na ve İTÜ Türk Musikîsi Devlet Konservatuvarı’nın değerli öğretim üyeleri ve müzisyenlerine teşekkürlerimi sunarım.

 
 

DİPNOTLAR:                                           

[1] Bilgisayar tarafından, her bir notaya karşılık gelen tonda ve belirtilen vuruş süresine sahip işaretler tablodaki sıralamaya göre üretilerek birbiri ardına eklenir. Bu işaretler bilgisayar hoparlöründe sese dönüştürülür.

 

KAYNAKLAR:                         

Dixon, S.  On the computer recognition of solo piano music.

Dodge, C., Jerse, T.A. (1999). Computer Music: Synthesis, Composition and Performance. Schirmer Books.

G Major Music Theory, http://www.gmajormusictheory.org (02.09.2006)

Gonzalez, R.C., Woods, R.E. (2002). Digital Image Processing, Second Edition. New Jersey: Prentice Hall.

Haykin, S., Van Veen, B. (2003). Signals and Systems, Second Edition. USA: John Wiley.

İman, Y. (1990). Piyano Metodu. Arkadaş Yayınevi.

Kayran, A.H., Ekşioğlu, E.M. (2004). Bilgisayar Uygulamalarıyla Sayısal İşaret İşleme. İstanbul: Birsen Yayınevi.

Kirk, R., Hunt, A. (1999). Digital Sound Processing for Music and Multimedia. Focal Press.

Musical Note Frequencies, http://www.techlib.com/reference/musical_note_frequencies.htm (02.09.2006)

Musictheory.Net, http://www.musictheory.net (02.09.2006)

Zeren, A. (1997). Akustik Ses Fiziği, 2. Basım. İstanbul: Pan Yayıncılık.

 www.muzikbilim.com
Bütün hakları saklıdır.