Örüntü tanıma problemlerinin genel özellikleri ve türleri. Örüntü tanıma yöntemleri Örüntü tanıma sistemleri

Otomatik örüntü tanıma yöntemleri ve bunların optik karakter tanıma sistemlerinde (Optik Karakter Tanıma - OCR sistemleri) uygulanması, en gelişmiş yapay zeka teknolojilerinden biridir. Bu teknolojinin geliştirilmesinde, Rus bilim adamları dünyanın önde gelen pozisyonlarını işgal ediyor.

Bir OCR sistemi, basılı veya el yazısı metnin (örneğin, bir tarayıcı aracılığıyla bir bilgisayara girilen) karakterlerini görüntülemek için özel programlar kullanan ve onu kelime işlemciler, metin editörleri tarafından işlenmeye uygun bir biçime dönüştüren bir otomatik görüntü tanıma sistemi olarak anlaşılır. , vb.

OCR kısaltması bazen Optik Karakter Okuyucu olarak deşifre edilir - optik karakter tanıma veya otomatik metin okuma için bir cihaz. Şu anda endüstriyel kullanımdaki bu tür cihazlar günde 100.000 belgeye kadar işliyor.

Endüstriyel kullanım, iyi ila orta kalitede belgelerin girişini içerir - bu, nüfus sayımı formlarının, vergi beyannamelerinin vb. işlenmesidir.

OCR sistemleri açısından önemli olan konu alanının özelliklerini listeliyoruz:

  • karakterlerin yazı tipi ve boyutu çeşitliliği;
  • sembollerin görüntülerinde bozulmalar (sembollerin görüntülerinde kırılmalar);
  • tarama sırasında bozulmalar;
  • görüntülerde yabancı kapanımlar;
  • farklı dillerde metin parçalarının kombinasyonu;
  • yalnızca ek bağlamsal bilgilerle tanınabilen çok çeşitli karakter sınıfları.

Basılı ve el yazısı metinlerin otomatik olarak okunması, karmaşık görüntülerin otomatik görsel algılanmasının özel bir durumudur. Sayısız araştırma, bu sorunu tam olarak çözmek için entelektüel tanımanın, yani "anlayarak tanımanın" gerekli olduğunu göstermiştir.

Tüm OCR sistemlerinin dayandığı üç ilke vardır.

  • 1. Görüntünün bütünlüğü ilkesi. İncelenen nesnede her zaman aralarında ilişkilerin olduğu önemli parçalar vardır. Görüntünün bölümleriyle yapılan yerel işlemlerin sonuçları, yalnızca ayrılmaz parçaları ve görüntünün tamamını bir bütün olarak yorumlama sürecinde birlikte yorumlanır.
  • 2. Amaçlılık ilkesi. Tanıma, hipotezler üretme ve test etme (bir nesneden ne beklendiğini bulma) amaçlı bir süreçtir.
  • 3. Uyarlanabilirlik ilkesi. Tanıma sistemi kendi kendine öğrenme yeteneğine sahip olmalıdır.

Önde gelen Rus OCR sistemleri: FineReader; FineReader El Yazması; formOkuyucu; CunieForm (Bilişsel Teknolojiler), Bilişsel Formlar (Bilişsel Teknolojiler) .

FineReader sistemi, 1989 yılında kurulan ABBYY tarafından üretilir. ABBYY iki yönde gelişir: yapay görme ve uygulamalı dilbilim. Bilimsel araştırma ve geliştirmenin stratejik yönü, yapay görme, yapay zeka ve uygulamalı dilbilim alanındaki teknolojilerin doğal dil yönüdür.

Windows için CuneiForm GOLD, dünyanın ilk kendi kendine öğrenen akıllı OCR sistemidir ve en son uyarlanabilir metin tanıma teknolojisini kullanır ve birçok dili destekler. Her dil için, bağlamsal kontrol ve tanıma sonuçlarının kalitesini iyileştirmek için bir sözlük sağlanır. Çok düşük kaliteli metinlerin yanı sıra dekoratif ve el yazısı hariç, yazıcılardan alınan tüm basım, daktilo yazı tiplerini ve yazı tiplerini tanır.

Örüntü tanıma sistemlerinin özellikleri. OSL teknolojileri arasında, belirli otomatik örüntü tanıma problem sınıflarını çözmek için özel teknolojiler büyük önem taşımaktadır:

  • insanları fotoğraflara göre arayın;
  • çeşitli ışık radyasyonu aralıklarında hava fotoğrafçılığına ve uydu görüntülerine dayalı maden yatakları ve hava tahmini aramak;
  • önceki görevde kullanılan ilk bilgilere dayalı olarak coğrafi haritaların derlenmesi;
  • adli tıp, güvenlik ve tıbbi sistemlerde irisin parmak izlerinin ve çizimlerinin analizi.

Bilginin hazırlanması ve işlenmesi aşamasında, özellikle bir işletmeyi bilgisayarlaştırırken, muhasebeyi otomatikleştirirken, bir PC'ye büyük miktarda metin ve grafik bilgisi girme görevi ortaya çıkar. Grafik bilgilerini girmek için kullanılan ana cihazlar şunlardır: tarayıcı, faks modem ve daha az sıklıkla dijital kamera. Ek olarak, optik metin tanıma programlarını kullanarak, bir bilgisayara metin bilgilerini de girebilirsiniz (sayısallaştırabilirsiniz). Modern yazılım ve donanım sistemleri, örneğin bir ağ tarayıcısı ve aynı anda birkaç bilgisayarda paralel metin tanıma kullanarak büyük miktarda bilginin bir bilgisayara girilmesini otomatikleştirmeyi mümkün kılar.

Çoğu OCR programı, faks modem, tarayıcı, dijital kamera veya başka bir aygıt aracılığıyla alınan bir bit eşlemle çalışır. İlk aşamada, OSA sistemi, sağ ve sol hizalamanın özelliklerine ve birkaç sütunun varlığına bağlı olarak sayfayı metin bloklarına ayırmalıdır. Tanınan blok daha sonra satırlara bölünür. Görünen basitliğe rağmen, bu çok açık bir görev değildir, çünkü pratikte katlandığında sayfa görüntüsünün veya parçalarının bozulması kaçınılmazdır. Hafif bir eğim bile, özellikle satır aralığı küçük olduğunda, bir satırın sol kenarının bir sonrakinin sağ kenarından daha düşük olmasına neden olur. Sonuç olarak, görüntünün bu veya bu parçasının ait olduğu çizgiyi belirleme sorunu vardır. Örneğin, mektuplar için

Çizgiler daha sonra görüntünün tek tek harflere karşılık gelen bitişik bölgelerine bölünür; tanıma algoritması, bu alanların karakterlere uygunluğu hakkında varsayımlarda bulunur ve daha sonra her karakter seçilir, bunun sonucunda sayfa metin karakterleri olarak ve kural olarak belirli bir biçimde geri yüklenir. OCR sistemleri en iyi tanıma doğruluğunu elde edebilir - sıradan yazı tiplerinden oluşan saf görüntüler için %99,9'un üzerinde. İlk bakışta, bu tanıma doğruluğu mükemmel görünüyor, ancak hata oranı hala iç karartıcı çünkü sayfa başına yaklaşık 1500 karakter varsa, o zaman %99,9 tanıma başarı oranıyla bile sayfa başına bir veya iki hata vardır. Bu gibi durumlarda sözlük kontrol yöntemini kullanmalısınız, yani belirli bir kelime sistem sözlüğünde yoksa özel kurallara göre benzerini bulmaya çalışacaktır. Ancak bu yine de hataların %100'ünün düzeltilmesine izin vermez ve sonuçların insan tarafından kontrol edilmesini gerektirir.

Gerçek hayatta karşılaşılan metinler genellikle mükemmel olmaktan uzaktır ve "saf olmayan" metinler için tanıma hatalarının yüzdesi genellikle kabul edilemez derecede yüksektir. Kirli görüntüler en belirgin sorundur çünkü küçük lekeler bile bir karakterin tanımlayıcı kısımlarını belirsizleştirebilir veya birini diğerine dönüştürebilir. Tarayıcının başında oturan operatör taranan her sayfayı düzleştiremediği ve tarayıcının kenarlarıyla doğru bir şekilde hizalayamadığı için, hatalı tarama da "insan faktörü" nedeniyle bir sorundur. Belgenin fotokopisi çekildiyse, genellikle karakterlerde kopmalar ve birleşimler olur. Bu etkilerden herhangi biri sistemin hata vermesine neden olabilir çünkü OSD sistemlerinden bazıları bir görüntünün bitişik bir alanının tek bir karakter olması gerektiğini varsaymaktadır. Sınırların dışında veya eğik bir sayfa, OSA sistemi tarafından karıştırılabilecek hafif çarpık karakter görüntüleri oluşturur.

OSL sistem yazılımı genellikle tarayıcıdan alınan sayfanın büyük bir bit eşlemiyle çalışır. Standart çözünürlük derecesine sahip görüntüler, 9600 p / d doğrulukla taranarak elde edilir. Bu çözünürlükteki bir A4 sayfa görüntü yaklaşık 1 MB bellek kaplar.

OCR sistemlerinin temel amacı, raster bilgilerini (taranmış karakter) analiz etmek ve bir görüntü parçasına karşılık gelen bir karakter atamaktır. Tanıma işlemi tamamlandıktan sonra OCR sistemleri, kaynak belgelerin formatını koruyabilmeli, bir paragraf özniteliğini doğru yere atayabilir, tabloları, grafikleri kaydedebilir vb. Modern tanıma programları bilinen tüm metin ve grafik formatlarını ve elektronik tablo formatlarını destekler, yanı sıra HTML ve PDF.

OCR sistemleriyle çalışmak, kural olarak, herhangi bir özel zorluğa neden olmamalıdır. Bu sistemlerin çoğu, en basit otomatik "tara ve tanı" moduna (Tara ve Oku) sahiptir ve ayrıca dosyalardan görüntüleri tanıma modunu da destekler. Ancak, belirli bir sistem için mümkün olan en iyi sonuçları elde etmek amacıyla, belirli bir metin tipine, antetli kağıt düzenine ve kağıt kalitesine göre önceden manuel olarak ayarlanması arzu edilir (ve genellikle gereklidir). Sınırların dışında veya eğik bir sayfa, OCR sistemi tarafından karıştırılabilecek hafif bozuk karakter görüntüleri oluşturur.

Bir OCR sistemiyle çalışırken, kullanıcı arayüzünün sezgiselliğinin yanı sıra, tanıma dilini ve tanınacak malzeme türünü (daktilo, faks, nokta vuruşlu yazıcı, gazete vb.) seçmek çok önemlidir. Birkaç dilin kullanıldığı metinleri tanırken, tanıma verimliliği OCR sisteminin dil grupları oluşturma yeteneğine bağlıdır. Aynı zamanda, bazı sistemler halihazırda Rusça ve İngilizce gibi en yaygın kullanılan diller için kombinasyonlara sahiptir.

Şu anda, metin tanımayı olasılıklardan biri olarak destekleyen çok sayıda program var. Bu alanda lider FineReader sistemidir. Programın en son sürümü (6.0) artık FineReader 6.0 teknolojisine dayalı yeni sistemler geliştirmek için araçlara sahiptir. FineReader 6.0 ailesi şunları içerir: FineReader 6.0 Professional, FineReader 6.0 Corporate Edition, FineReader Scripting Edition 6.0 ve FineReader Engine 6.0. FineReader 6.0 sistemi, PDF dahil olmak üzere çok sayıda kaydetme biçimini bilmenin yanı sıra, PDF dosyalarından doğrudan tanıma yeteneğine sahiptir. Yeni Akıllı Arka Plan Filtreleme teknolojisi (akıllı arka plan filtreleme), belgenin dokusu ve görüntünün arka plan gürültüsü hakkındaki bilgileri filtrelemenize olanak tanır: bazen bir belgedeki metni vurgulamak için gri veya renkli bir arka plan kullanılır. Bu, bir kişinin okumasını engellemez, ancak geleneksel metin tanıma algoritmaları, böyle bir arka planın üzerinde bulunan harflerle çalışırken ciddi zorluklar yaşar. FineReader, metni belgenin arka planından ayırarak, belirli bir boyuttan daha küçük noktaları bularak ve bunları kaldırarak bu tür metin içeren bölgeleri algılayabilir. Aynı zamanda, harflerin dış çizgileri korunur, böylece bu dış hatlara yakın olan arka plan noktaları, metin tanıma kalitesini düşürebilecek parazitlere neden olmaz.

Tasarımcılar, modern yerleşim programlarının yeteneklerini kullanarak, genellikle çok sütunlu metni dikdörtgen olmayan bir görüntünün etrafına sarmak gibi karmaşık şekilli nesneler oluşturur. FineReader 6.0, bu tür nesnelerin tanınmasını ve MS Word dosyalarına kaydedilmesini destekler. Artık karmaşık yerleşim belgeleri bu metin düzenleyicide doğru bir şekilde yeniden oluşturulacaktır. Düzenleme için tüm olasılıkları korurken tablolar bile maksimum doğrulukla tanınır.

ABBYY FormReader, ABBYY'nin ABBYY FineReader Engine tabanlı tanıma programlarından biridir. Bu program, manuel olarak doldurulabilen formları tanımak ve işlemek için tasarlanmıştır. ABBYY FormReader, yapısı değişebilen formların yanı sıra sabit bir düzene sahip formları da işleyebilir. Tanıma için yeni ABBYY FlexiForm teknolojisi kullanıldı.

Önde gelen yazılım üreticileri, ürünleriyle birlikte kullanılmak üzere Rus bilgi teknolojisini lisanslamıştır. Popüler yazılım paketleri Corel Draw (Corel Corporation), FaxLine/OCR & Business Card Wizard (Inzer Corporation) ve diğer pek çoğu yerleşik CuneiForm OCR kitaplığına sahiptir. Bu program, Rusya'da MS Windows Uyumlu Logosunu alan ilk OCR sistemi oldu.

Readiris Pro 7, profesyonel bir metin tanıma programıdır. Üreticilere göre, bu OCR sistemi mektuplar, fakslar, dergi makaleleri, gazete kupürleri gibi sıradan (günlük) basılı belgeleri düzenlenebilir nesnelere (PDF dosyaları dahil) dönüştürmede en yüksek doğrulukta analoglardan farklıdır. Programın ana avantajları şunlardır: JPEG format yöntemini kullanarak "maksimum" (maksimum kalite kaybıyla) sıkıştırılmış görüntüleri az çok doğru bir şekilde tanıma yeteneği, dijital kameralar için destek ve sayfa yönünü otomatik algılama, destek 92 dile kadar (Rusça dahil).

OmniPage 11, bir ScanSoft ürünüdür. Bu programın sınırlı bir sürümü (OmniPage 11 Limited Edition, OmniPage Lite) genellikle yeni tarayıcılarla (Avrupa ve ABD'de) birlikte gelir. Geliştiriciler, programlarının basılı belgeleri neredeyse %100 doğrulukla tanıdığını, sütunlar, tablolar, tireleme (kelimelerin bölümlerinin tirelenmesi dahil), başlıklar, bölüm başlıkları, imzalar, sayfa numaraları, dipnotlar, paragraflar, numaralı listeler dahil olmak üzere biçimlendirmelerini geri yüklediğini iddia ediyor. , kırmızı çizgiler, grafikler ve resimler. Microsoft Office, PDF ve diğer 20 formata kaydetmek, PDF dosyalarından tanımak ve bu formatta düzenlemek mümkündür. Yapay zeka sistemi, ilk manuel düzeltmeden sonra hataları otomatik olarak tespit edip düzeltmenizi sağlar. Özel olarak geliştirilmiş yeni bir yazılım modülü "Dcspeckle", kalitesi düşük belgeleri (fakslar, kopyalar, kopyaların kopyaları vb.) tanımanıza olanak tanır. Programın avantajı, renkli metni tanıma ve sesle düzeltme yeteneğidir. Macintosh bilgisayarlar için OmniPage'in bir sürümü de mevcuttur.

  • Santimetre.: Bashmakov A.I., Bashmakov I.A. Akıllı bilgi teknolojileri.

Görüntü, incelenen nesnenin veya olgunun, her bir öğesi karşılık gelen nesneyi karakterize eden özelliklerden birinin sayısal değerini temsil eden bir özellik vektörü ile temsil edilen yapılandırılmış bir açıklaması olarak anlaşılır.

Tanıma sisteminin genel yapısı aşağıdaki gibidir:

Tanıma probleminin anlamı, çalışılan nesnelerin belirli bir sınıfa atanmalarına izin veren sabit bir sonlu özelliklere sahip olup olmadığını belirlemektir. Tanıma görevleri aşağıdaki karakteristik özelliklere sahiptir:

1. Bunlar iki aşamadan oluşan bilgi görevleridir:

a. Kaynak verileri tanıma için uygun bir forma getirmek.

b. Tanıma, bir nesnenin belirli bir sınıfa ait olduğunun bir göstergesidir.

2. Bu problemlerde, nesnelerin analojisi veya benzerliği kavramı tanıtılabilir ve nesnelerin aynı sınıfa veya farklı sınıflara atanması için temel olarak nesnelerin yakınlığı kavramı formüle edilebilir.

3. Bu görevlerde, bir dizi emsal ile çalışabilirsiniz - sınıflandırması bilinen ve öğrenme sürecindeki göreve uyum sağlamak için resmileştirilmiş açıklamalar şeklinde tanıma algoritmasına sunulabilen örnekler.

4. Bu problemler için, biçimsel teoriler oluşturmak ve klasik matematiksel yöntemleri uygulamak zordur: genellikle doğru bir matematiksel model için bilgi veya model ve matematiksel yöntemlerin kullanılmasından elde edilen kazanç, maliyetlerle kıyaslanamaz.

5. Bu görevlerde “kötü bilgi” mümkündür - boşluklu, heterojen, dolaylı, bulanık, belirsiz, olasılıklı bilgiler.

Aşağıdaki tanıma görevi türlerini ayırt etmeniz önerilir:

1. Tanıma görevi, yani sunulan nesnenin açıklamasına göre verilen sınıflardan birine atanması (bir öğretmenle eğitim).

2. Otomatik sınıflandırmanın görevi, bir dizi nesnenin (durumların) tanımlarına göre örtüşmeyen bir sınıflar sistemine (taksonomi, küme analizi, denetimsiz öğrenme) bölünmesidir.

3. Tanıma konusunda bilgilendirici bir dizi özellik seçme sorunu.

4. İlk verileri tanıma için uygun bir forma indirgeme sorunu.

5. Dinamik tanıma ve dinamik sınıflandırma - dinamik nesneler için görevler 1 ve 2.

6. Tahmin görevi - çözümün gelecekteki bir ana atıfta bulunması gereken 5. görevler.

Bir görüntü kavramı.

Bir görüntü, bir sınıf, belirli bir nesne grubunu bazı niteliklere göre birleştiren (ayıran) sistemdeki bir sınıflandırma gruplamasıdır. Görüntüler, aynı kümeden sınırlı sayıda fenomenle tanışmanın, keyfi olarak çok sayıda temsilcisini tanımayı mümkün kıldığı gerçeğinde ortaya çıkan bir dizi karakteristik özelliğe sahiptir.


Bir görüntü olarak, kontrol nesnesinin belirli bir durum kümesi de düşünülebilir ve bu durum dizisinin tümü, belirli bir hedefe ulaşmak için nesne üzerinde aynı etkinin gerekli olduğu gerçeğiyle karakterize edilir. Görüntüler, farklı gözlem materyallerinden öğrenen farklı insanların, çoğunlukla aynı nesneleri aynı şekilde ve birbirinden bağımsız olarak sınıflandırması anlamında, karakteristik nesnel özelliklere sahiptir.

Genel olarak, örüntü tanıma problemi iki bölümden oluşur: eğitim ve tanıma.

Eğitim, bir veya başka bir görüntüye ait olduklarını gösteren bireysel nesneler gösterilerek gerçekleştirilir. Eğitim sonucunda tanıma sistemi, aynı görüntüdeki tüm nesnelere aynı tepkilerle ve farklı görüntüdeki tüm nesnelere farklı tepkilerle yanıt verme yeteneği kazanmalıdır.

Öğrenme sürecinin, başka herhangi bir istem olmadan yalnızca sınırlı sayıda nesne görüntüleyerek sona ermesi çok önemlidir. Öğrenme nesneleri, görsel görüntüler veya dış dünyanın çeşitli fenomenleri ve diğerleri olabilir.

Eğitimi, önceden eğitilmiş bir sistemin işleyişini karakterize eden yeni nesnelerin tanınması süreci takip eder. Bu prosedürlerin otomasyonu, örüntü tanıma eğitiminin sorunudur. Bir kişinin kendisinin tahmin etmesi veya icat etmesi ve daha sonra bilgisayara sınıflandırma kurallarını dayatması durumunda, sorunun ana ve ana kısmı (eğitim) kişi tarafından üstlenildiği için tanıma sorunu kısmen çözülür.

Örüntü tanıma eğitimi sorunu hem uygulamalı hem de temel bakış açısından ilginçtir. Uygulamalı bir bakış açısından, bu sorunun çözümü her şeyden önce önemlidir, çünkü şimdiye kadar yalnızca canlı bir beynin aktivitesiyle ilişkilendirilen birçok işlemi otomatikleştirme olasılığını açar. Sorunun temel önemi, bir bilgisayarın ilke olarak neyi yapıp neyi yapamayacağı sorusuyla bağlantılıdır.

Örüntü tanıma yöntemlerini yönetme problemlerini çözerken, "görüntü" terimi yerine "durum" terimi kullanılır. Durum - gözlemlenen nesnenin ölçülen akım (anlık) özelliklerini göstermenin belirli biçimleri, durum kümesi durumu belirler.

Bir duruma genellikle, her biri nesnenin aynı veya benzer özellikleri ile karakterize edilen, karmaşık bir nesnenin belirli bir dizi durumu denir. Örneğin, belirli bir kontrol nesnesi bir gözlem nesnesi olarak kabul edilirse, durum bu nesnenin aynı kontrol eylemlerinin uygulanması gereken durumlarını birleştirir. Gözlem nesnesi bir oyunsa, durum oyunun tüm durumlarını birleştirir.

Nesnelerin ilk tanımının seçimi, örüntü tanıma öğrenme probleminin merkezi görevlerinden biridir. Başlangıç ​​tanımının (özellik alanı) başarılı bir şekilde seçilmesiyle, tanıma görevi önemsiz hale gelebilir. Tersine, başarısız bir şekilde seçilen bir ilk tanım, ya bilginin çok zor bir şekilde işlenmesine ya da hiç çözüm olmamasına yol açabilir.

Geometrik ve yapısal yaklaşımlar.

Öğrenme veya sınav sürecinde bir nesneyi gözlemlemenin bir sonucu olarak ortaya çıkan herhangi bir görüntü, bir vektör olarak ve dolayısıyla bazı özellik uzayında bir nokta olarak temsil edilebilir.

Görüntüler gösterilirken onları iki (veya birkaç) görüntüden birine açık bir şekilde atfetmenin mümkün olduğu iddia edilirse, o zaman bazı uzayda ortak noktaları olmayan iki veya daha fazla bölgenin olduğu ve bir noktanın görüntüsü bu bölgelerdendir. Böyle bir alanın her noktasına bir isim verilebilir, yani görüntüye karşılık gelen bir isim verilebilir.

Örüntü tanımayı öğrenme sürecini geometrik bir resim açısından yorumlayalım, şimdilik kendimizi sadece iki deseni tanıma durumuyla sınırlayalım. Önceden bilinen tek şey, bir uzayda iki bölgeyi ayırmanın gerekli olduğu ve sadece bu bölgelerden gelen noktaların gösterildiğidir. Bu alanların kendileri önceden belirlenmemiştir, yani bir noktanın belirli bir alana ait olup olmadığını belirlemek için sınırlarının veya kurallarının konumu hakkında hiçbir bilgi yoktur.

Eğitim sırasında bu alanlardan rastgele seçilen noktalar sunulur ve sunulan noktaların hangi alana ait olduğu hakkında bilgi verilir. Bu alanlar hakkında ek bilgi, yani eğitim sırasında sınırlarının yeri bildirilmez.

Öğrenmenin amacı, ya sadece öğrenme sürecinde gösterilen noktaları değil, aynı zamanda bu alanlara ait diğer tüm noktaları ayıracak bir yüzey oluşturmak ya da bu alanları birbirine bağlayan yüzeyler oluşturmak, böylece her biri yalnızca öğrenme noktalarını içerecektir. aynı görüntü. Başka bir deyişle, öğrenmenin amacı, örneğin bir görüntünün tüm noktalarında pozitif ve başka bir görüntünün tüm noktalarında negatif olacak görüntü vektörlerinden bu tür işlevleri oluşturmaktır.

Bölgelerin ortak noktaları olmadığı için, her zaman bir dizi böyle ayırma işlevi vardır ve öğrenme sonucunda bunlardan birinin inşa edilmesi gerekir. Sunulan görüntüler iki değil, daha fazla sayıda görüntüye aitse, görev, eğitim sırasında gösterilen noktalara göre, bu görüntülere karşılık gelen tüm alanları birbirinden ayıran bir yüzey oluşturmaktır.

Bu problem, örneğin, bölgelerin her birinin noktaları üzerinden aynı değeri alan bir fonksiyon oluşturularak çözülebilir ve bu fonksiyonun farklı bölgelerden gelen noktalar üzerindeki değeri farklı olmalıdır.

Alandan sadece belirli sayıda noktayı bilmek, tüm alanı ayırmak için yeterli olmayabilir. Gerçekten de, bu noktaları içeren sayısız farklı bölge belirlenebilir ve bölgeyi seçen yüzey bunlardan nasıl inşa edilmiş olursa olsun, yüzeyi kesen ve aynı zamanda aynı zamanda yüzeyi içeren başka bir bölge belirlemek her zaman mümkündür. gösterilen noktalar.

Bununla birlikte, sınırlı bir nokta kümesindeki bir fonksiyon hakkında bilgiden bir fonksiyona yaklaşma probleminin, fonksiyonun verildiği tüm kümeden çok daha dar olduğu ve fonksiyonların yaklaşıklaştırılmasının yaygın bir matematik problemi olduğu bilinmektedir. Elbette, bu tür problemlerin çözümü, söz konusu işlevler sınıfına belirli kısıtlamaların getirilmesini gerektirir ve bu kısıtlamaların seçimi, öğretmenin öğrenme sürecine ekleyebileceği bilgilerin doğasına bağlıdır.

Böyle bir ipucu, görüntülerin kompaktlığı hakkındaki varsayımdır.

Kalıpları tanımayı öğrenme probleminin geometrik yorumuyla birlikte, yapısal veya dilsel olarak adlandırılan başka bir yaklaşım daha vardır. Görsel görüntü tanıma örneğinde dilsel yaklaşımı ele alalım.

İlk olarak, bir dizi başlangıç ​​kavramı ayırt edilir - görüntüde bulunan tipik parçalar ve parçaların göreceli konumunun özellikleri (sol, alt, iç vb.). Bu ilk kavramlar, bazen cümle olarak adlandırılan çeşitli mantıksal ifadeler oluşturmanıza izin veren bir kelime dağarcığı oluşturur.

Görev, bu kavramlar kullanılarak oluşturulabilecek çok sayıda ifade arasından, bu özel durum için en önemli olanı seçmektir. Ayrıca, her görüntüden sınırlı ve mümkünse az sayıda nesneye bakarak, bu görüntülerin bir tanımını oluşturmak gerekir.

Oluşturulan betimlemeler, verilen nesnenin hangi görüntüye ait olduğu sorusunu çözecek kadar eksiksiz olmalıdır. Dilsel yaklaşımı uygularken iki görev ortaya çıkar: bir başlangıç ​​sözlüğü, yani bir dizi tipik parça oluşturma görevi ve belirli bir sözlüğün öğelerinden açıklama kuralları oluşturma görevi.

Dilsel yorumlama çerçevesinde, görüntülerin yapısı ile bir dilin sözdizimi arasında bir analoji kurulur. Bu benzetme arzusu, matematiksel dilbilim aygıtını kullanma olasılığından kaynaklandı, yani yöntemler doğada sözdizimseldir. Görüntülerin yapısını tanımlamak için matematiksel dilbilim aygıtının kullanılması, ancak görüntülerin bileşen parçalara bölünmesi yapıldıktan, yani tipik parçaları ve arama yöntemlerini tanımlamak için kelimeler geliştirildikten sonra uygulanabilir.

Sözcük seçimini sağlayan ön çalışmadan sonra, görüntü tanıma için açıklamaların otomatik dilbilgisel ayrıştırma görevlerinden oluşan uygun dilbilimsel görevler ortaya çıkar.

kompaktlık hipotezi.

Öğrenme sürecinde, öznitelik uzayının planlı sınıflandırmaya dayalı olarak oluşturulduğunu varsayarsak, öznitelik uzayının kendisinin belirtiminin, bu uzaydaki hangi görüntülerin etkisi altında kolayca ayrılabileceği bir özellik belirlediğini umabiliriz. Bu umutlar, örüntü tanıma alanındaki çalışmalar geliştikçe, özellik uzayındaki kompakt kümelerin örüntülere karşılık geldiğini belirten kompaktlık hipotezinin ortaya çıkmasını teşvik etti.

Kompakt bir küme ile, onları bu kümeler arasında ayıran nadirlikler olduğunu varsayarak, görüntü uzayındaki belirli nokta kümelerini anlayacağız. Ancak, bu hipotez her zaman deneysel olarak doğrulanmamıştır. Ancak, kompaktlık hipotezinin iyi bir şekilde yerine getirildiği problemler her zaman basit bir çözüm buldu ve bunun tersi, hipotezi doğrulanmayan problemler ya hiç çözülmedi ya da büyük zorluklarla ve ek bilgilerle çözüldü.

Kompaktlık hipotezinin kendisi, tanıma problemlerini tatmin edici bir şekilde çözme olasılığının bir işaretine dönüşmüştür.

Kompaktlık hipotezinin formülasyonu bizi soyut bir görüntü kavramına yaklaştırıyor. Uzayın koordinatları rastgele seçilirse, içindeki görüntüler rastgele dağıtılacaktır. Uzayın bazı bölümlerinde diğerlerinden daha yoğun olacaklar.

Rastgele seçilmiş bazı uzaylara soyut bir görüntü diyelim. Bu soyut uzayda, neredeyse kesinlikle kompakt nokta kümeleri olacaktır. Bu nedenle, kompaktlık hipotezine göre, soyut bir uzayda kompakt nokta kümelerinin karşılık geldiği nesne kümesine genellikle belirli bir uzayın soyut görüntüleri denir.

Eğitim ve kendi kendine eğitim, adaptasyon ve eğitim.

Görüntülerin doğasına veya görüntülerine bağlı olmayan, ancak yalnızca ayrılabilirlik yeteneğini belirleyen belirli bir evrensel özelliği fark etmek mümkün olsaydı, o zaman her birinin ait olduğu hakkında bilgi kullanarak tanıma öğretme olağan görevi ile birlikte. eğitim dizisinden bir görüntüye veya diğerine nesne, farklı bir sınıflandırma problemi ortaya koymak daha iyi olabilir - sözde öğretmensiz öğrenme problemi.

Tanımlayıcı düzeyde bu tür bir görev şu şekilde formüle edilebilir: nesneler, sisteme ait olduklarına dair herhangi bir belirti olmaksızın eşzamanlı veya sıralı olarak sisteme sunulur. Sistemin giriş cihazı, bir dizi nesneyi bir dizi görüntü üzerine eşler ve önceden içine gömülü olan bazı görüntü ayrılabilirlik özelliklerini kullanarak, bu nesnelerin bağımsız bir sınıflandırmasını yapar.

Böyle bir kendi kendine öğrenme sürecinden sonra, sistem yalnızca zaten bilinen nesneleri (eğitim dizisindeki nesneler) değil, aynı zamanda daha önce sunulmamış olanları da tanıma yeteneğini kazanmalıdır. Belirli bir sistemin kendi kendine öğrenme süreci böyle bir süreçtir, bunun sonucunda bu sistem, bir öğretmenin yardımı olmadan, aynı görüntünün nesnelerinin görüntülerine aynı tepkileri ve farklı tepkilere karşı farklı tepkiler geliştirme yeteneğini kazanır. farklı görüntülerin görüntüleri.

Bu durumda öğretmenin rolü, yalnızca tüm görüntüler için aynı olan ve bir dizi nesneyi görüntülere bölme yeteneğini belirleyen bazı nesnel özellikler sistemini harekete geçirmekten ibarettir.

Böyle bir nesnel özelliğin, görüntülerin kompaktlığının özelliği olduğu ortaya çıktı. Seçilen uzaydaki noktaların karşılıklı düzenlenmesi, noktaların nasıl bölünmesi gerektiği hakkında zaten bilgi içerir. Bu bilgi, örüntü tanıma sisteminin kendi kendine öğrenmesi için yeterli olan örüntü ayrılabilirlik özelliğini belirler.

İyi bilinen kendi kendine öğrenme algoritmalarının çoğu, yalnızca soyut görüntüleri, yani belirli alanlardaki kompakt kümeleri seçebilir. Aralarındaki fark, kompaktlık kavramının resmileştirilmesinde yatmaktadır. Bununla birlikte, çoğu zaman görüntülerin kendileri kimse tarafından önceden belirlenmediğinden ve görev, belirli bir alandaki hangi görüntü alt kümelerinin görüntü olduğunu belirlemek olduğundan, bu, kendi kendine öğrenme algoritmalarının değerini azaltmaz ve hatta bazen artırır.

Sorunun böyle bir ifadesine bir örnek, insan gruplarının bir dizi soruya göre seçildiği sosyolojik araştırmadır. Problemin bu şekilde anlaşılmasında, kendi kendine öğrenen algoritmalar, önceden kimsenin daha önce hiçbir fikrinin olmadığı, belirli bir görüntü alanında varlığı hakkında a priori bilinmeyen bilgiler üretir.

Ek olarak, kendi kendine öğrenmenin sonucu, seçilen alanın belirli bir tanıma öğrenme görevi için uygunluğunu karakterize eder. Kendi kendine öğrenme alanına ayrılan soyut görüntüler, gerçek olanlarla örtüşüyorsa, alan başarıyla seçilmiştir. Soyut görüntüler gerçek olanlardan ne kadar farklı olursa, belirli bir görev için seçilen alan o kadar elverişsiz olur.

Öğrenmeye genellikle, bir sistemde, dış düzeltme sistemini tekrar tekrar etkileyerek, dışsal özdeş sinyal gruplarına belirli bir tepki geliştirme süreci denir. Bu ayarlamayı oluşturan mekanizma, öğrenme algoritmasını neredeyse tamamen belirler.

Kendi kendine öğrenme, öğrenmeden farklıdır, çünkü burada sisteme verilen tepkinin doğruluğu hakkında ek bilgi rapor edilmez.

Adaptasyon, başlangıçtaki belirsizlik ve değişen çalışma koşulları ile sistemin belirli bir durumunu elde etmek için mevcut bilgilere dayalı olarak sistemin parametrelerini ve yapısını ve muhtemelen kontrol eylemlerini değiştirme sürecidir.

Öğrenme, sistemin kademeli olarak belirli dış etkilere gerekli tepkilerle yanıt verme yeteneğini kazandığı bir süreçtir ve adaptasyon, gerekli kaliteyi elde etmek için sistemin parametrelerinin ve yapısının ayarlanmasıdır. dış koşullarda sürekli değişiklik koşulları altında kontrol.


Konuşma tanıma sistemleri.

Konuşma, insanlar arasındaki ana iletişim aracı olarak işlev görür ve bu nedenle konuşma iletişimi, yapay zeka sisteminin en önemli bileşenlerinden biri olarak kabul edilir. Konuşma tanıma, bir mikrofon veya telefonun çıkışında üretilen akustik bir sinyali bir dizi kelimeye dönüştürme işlemidir.

Daha zor bir görev, akustik sinyalin anlamının tanımlanmasıyla ilişkili olan konuşmayı anlama görevidir. Bu durumda, konuşma tanıma alt sisteminin çıktısı, ifade anlama alt sisteminin girdisi olarak hizmet eder. Otomatik konuşma tanıma (APP sistemleri), doğal dil işleme teknolojilerinin alanlarından biridir.

Otomatik konuşma tanıma, bilgisayarlara metin girişinin otomatikleştirilmesinde, veritabanlarına veya bilgi alma sistemlerine sözlü sorguların oluşturulmasında, çeşitli akıllı cihazlara sözlü komutların oluşturulmasında kullanılır.

Konuşma tanıma sistemlerinin temel kavramları.

Konuşma tanıma sistemleri birçok parametre ile karakterize edilir.

Ana parametrelerden biri kelime tanıma hatasıdır (ORF). Bu parametre, tanınmayan kelime sayısının, konuşulan toplam kelime sayısına oranıdır.

Otomatik konuşma tanıma sistemlerini karakterize eden diğer parametreler şunlardır:

1) sözlük boyutu,

2) konuşma modu,

3) konuşma tarzı,

4) konu alanı,

5) konuşmacı bağımlılığı,

6) akustik gürültü seviyesi,

7) giriş kanalının kalitesi.

Sözlüğün boyutuna bağlı olarak, APP sistemleri üç gruba ayrılır:

Küçük bir sözlük boyutuyla (100 kelimeye kadar),

Ortalama bir sözlük boyutuyla (100 kelimeden birkaç bin kelimeye kadar),

Büyük bir sözlük boyutuyla (10.000'den fazla kelime).

Konuşma modu, kelimelerin ve ifadelerin telaffuz edilme şeklini karakterize eder. Sürekli konuşmayı tanımak için sistemler ve yalnızca izole konuşma sözcüklerini tanımaya izin veren sistemler vardır. Yalıtılmış sözcük tanıma modu, konuşmacının sözcükler arasında kısa bir süre duraklamasını gerektirir.

Konuşma tarzına göre APP sistemleri iki gruba ayrılır: deterministik konuşma sistemleri ve spontan konuşma sistemleri.

Deterministik konuşma tanıma sistemlerinde konuşmacı, dilin gramer kurallarına göre konuşmayı yeniden üretir. Kendiliğinden konuşma, dilbilgisi kurallarının ihlali ile karakterizedir ve tanınması daha zordur.

Konu alanına bağlı olarak, son derece uzmanlaşmış alanlarda (örneğin veri tabanlarına erişim) uygulamaya odaklanan APP sistemleri ve sınırsız kapsamlı APP sistemleri vardır. İkincisi, büyük miktarda kelime dağarcığı gerektirir ve kendiliğinden konuşmanın tanınmasını sağlamalıdır.

Birçok otomatik konuşma tanıma sistemi konuşmacıya bağlıdır. Bu, sistemi belirli bir konuşmacının telaffuzunun özelliklerine göre önceden ayarlamayı içerir.

Konuşma tanıma problemini çözmenin karmaşıklığı, akustik sinyallerin yüksek değişkenliği ile açıklanmaktadır. Bu değişkenlik birkaç nedenden kaynaklanmaktadır:

İlk olarak, farklı ses birimleri uygulaması - dilin ses sisteminin temel birimleri. Fonemlerin uygulanmasındaki değişkenlik, konuşma akışındaki komşu seslerin etkisinden kaynaklanır. Ses ortamından dolayı fonemlerin gerçekleşme tonlarına alofon denir.

İkincisi, akustik alıcıların konumu ve özellikleri.

Üçüncüsü, aynı konuşmacının konuşmasının parametrelerindeki, konuşmacının farklı duygusal durumundan, konuşmasının hızından kaynaklanan değişiklikler.

Şekil, konuşma tanıma sisteminin ana bileşenlerini göstermektedir:

Sayısallaştırılmış konuşma sinyali, ses tanıma için gerekli özelliklerin çıkarıldığı ön işleme birimine girer. Ses tanıma genellikle yapay sinir ağı modelleri kullanılarak yapılır. Seçilen ses birimleri daha sonra, giriş konuşma sinyaline en iyi uyan sözcük dizisini aramak için kullanılır.

Bir sözcük dizisi araması, akustik, sözcüksel ve dil modelleri kullanılarak gerçekleştirilir. Model parametreleri, ilgili öğrenme algoritmalarına dayalı olarak eğitim verilerinden belirlenir.

Metinle konuşmanın sentezi. Temel konseptler

Çoğu durumda, iletişim unsurlarıyla yapay zeka sistemlerinin oluşturulması, mesajların konuşma biçiminde çıktısını gerektirir. Şekil, konuşma arayüzüne sahip akıllı bir soru-cevap sisteminin blok şemasını göstermektedir:

Resim 1.

Oleg'den bir parça ders alın

Konuşma bölümlerinin tanınması örneğinde ampirik yaklaşımın özelliklerini düşünün. Görev, cümledeki kelimelere etiketler atamaktır: isim, fiil, edat, sıfat ve benzeri. Ayrıca isimlerin ve fiillerin bazı ek özelliklerini tanımlamak gerekir. Örneğin, bir isim için bir sayıdır ve bir fiil için bir formdur. Görevi resmileştiriyoruz.

Cümleyi bir kelime dizisi olarak temsil edelim: W=w1 w2…wn, burada wn, her biri dil sözlüğüne ait olası değerlerden birini alan rastgele değişkenlerdir. Cümlenin kelimelerine atanan etiket dizisi, X=x1 x2 … xn dizisi ile temsil edilebilir, burada xn, değerleri olası etiketler kümesinde tanımlanan rastgele değişkenlerdir.

O zaman konuşmanın bir kısmını tanıma problemi, w1, w2, …, wn kelimelerinin sırası verilen x1, x2, …, xn etiketlerinin en olası sırasını bulmaktır. Başka bir deyişle, maksimum koşullu olasılık P(x1, x2, …, xn| w1 w2.. wn) sağlayan böyle bir X*=x1 x2 … xn etiket dizisini bulmak gerekir.

P(X| W) koşullu olasılığını P(X| W)=P(X,W) / P(W) olarak yeniden yazalım. X değişkeni için maksimum koşullu olasılık P(X,W) bulmak gerektiğinden, X*=arg x max P(X,W) elde ederiz. Ortak olasılık P(X,W) koşullu olasılıkların bir ürünü olarak yazılabilir: P(X,W)=ürün bölü u-1'den n'ye P(x i |x1,…,x i -1 , w1,…, w ben -1 ) P(w ben |x1,…,x ben -1 , w1,…,w ben -1). Bu ifadenin maksimumu için doğrudan arama zor bir iştir, çünkü n'nin büyük değerleri için arama alanı çok büyür. Bu nedenle, bu çarpımda yazılan olasılıklar, daha basit koşullu olasılıklarla yaklaşıklaştırılır: P(x i |x i -1) P(w i |w i -1). Bu durumda, x i etiketinin değerinin yalnızca önceki x i -1 etiketi ile ilişkili olduğu ve daha önceki etiketlere bağlı olmadığı ve w i kelimesinin olasılığının yalnızca mevcut x i etiketi tarafından belirlendiği varsayılır. Bu varsayımlara Markovian denir ve sorunu çözmek için Markov modelleri teorisi kullanılır. Markov varsayımlarını dikkate alarak şunları yazabiliriz:

X*= arg x1, …, xn maks П ben =1 n P(x ben |x ben -1) P(wi|wi-1)

Koşullu olasılıkların bir dizi eğitim verisi üzerinde tahmin edildiği durumlarda

X* etiket dizisinin aranması, Viterbi dinamik programlama algoritması kullanılarak gerçekleştirilir. Viterbi algoritması, köşelerin kelime etiketlerine karşılık geldiği durum grafiği arama algoritmasının bir çeşidi olarak düşünülebilir.

Karakteristik olarak, herhangi bir geçerli köşe için, alt etiketler kümesi her zaman aynıdır. Ayrıca, her alt köşe için, üst köşe kümeleri de çakışır. Bu, tüm olası etiket kombinasyonları dikkate alınarak durum grafiğinde geçişlerin yapılması gerçeğiyle açıklanır. Markov'un varsayımı, kelimelere etiket atamanın yüksek doğruluğunu korurken, konuşma bölümlerinin tanınması probleminin önemli bir basitleştirilmesini sağlar.

Yani 200 etiketle atama doğruluğu yaklaşık %97'dir. Uzun bir süre boyunca, stokastik bağlamdan bağımsız gramerler kullanılarak emperyal analiz yapıldı. Ancak, önemli bir dezavantajı var. Aynı olasılıkların farklı ayrıştırmalara atanabilmesi gerçeğinde yatmaktadır. Bunun nedeni, ayrıştırma olasılığının, ayrıştırmada yer alan kuralların olasılıklarının bir ürünü olarak temsil edilmesidir. Analiz sırasında aynı olasılıklarla karakterize edilen farklı kurallar kullanılırsa, bu belirtilen soruna yol açar. En iyi sonuçlar, dilin kelime dağarcığını dikkate alan bir dilbilgisi tarafından verilir.

Bu durumda kurallar, farklı sözlük ortamlarında aynı kural için farklı olasılık değerleri sağlayan gerekli sözlük bilgilerini içerir. Imperial ayrıştırma, klasik anlamda geleneksel ayrıştırmaya göre örüntü tanıma ile daha uyumludur.

Karşılaştırmalı çalışmalar, doğal dil uygulamalarının emperyal ayrıştırmasının doğruluğunun geleneksel ayrıştırmaya göre daha yüksek olduğunu göstermiştir.

Ders numarası 17.DESEN TANIMA YÖNTEMLERİ

Aşağıdaki tanıma yöntemi grupları vardır:

Yakınlık Fonksiyon Yöntemleri

Diskriminant Fonksiyon Yöntemleri

İstatistiksel tanıma yöntemleri.

Dilsel Yöntemler

sezgisel yöntemler.

İlk üç grup yöntem, sayısal bileşenlerle sayılar veya vektörlerle ifade edilen özelliklerin analizine odaklanmıştır.

Dilsel yöntemler grubu, ilgili yapısal özellikler ve aralarındaki ilişkilerle tanımlanan yapılarının analizine dayalı olarak örüntü tanıma sağlar.

Sezgisel yöntemler grubu, örüntü tanımada insanlar tarafından kullanılan karakteristik teknikleri ve mantıksal prosedürleri birleştirir.

Yakınlık Fonksiyon Yöntemleri

Bu grubun yöntemleri, tanınabilir görüntü ile vektör arasındaki yakınlık ölçüsünü değerlendiren fonksiyonların kullanımına dayanmaktadır. x * = (x * 1 ,….,x*n) ve vektörlerle temsil edilen çeşitli sınıfların referans görüntüleri x ben = (x ben 1 ,…, x ben n), ben= 1,…,N, nerede i- resim sınıf numarası

Bu yönteme göre tanıma prosedürü, tanınan görüntünün noktası ile referans görüntüyü temsil eden noktaların her biri, yani. tüm değerlerin hesaplanmasında ben , ben= 1,…,N. Görüntü, değerin bulunduğu sınıfa aittir. ben hepsi arasında en düşük değere sahip ben= 1,…,N .

Her bir vektör çiftini eşleyen bir fonksiyon x ben, x * yakınlıklarının bir ölçüsü olarak gerçek bir sayı, yani. aralarındaki mesafeyi belirlemek oldukça keyfi olabilir. Matematikte böyle bir fonksiyona uzay metriği denir. Aşağıdaki aksiyomları karşılamalıdır:

r(x,y)=r(y,x);

r(x,y) > 0 ise x eşit değil y ve r(x,y)=0 ise x=y;

r(x,y) <=r(x,z)+r(z,y)

Bu aksiyomlar, özellikle aşağıdaki işlevlerle karşılanır:

bir ben= 1/2 , j=1,2,…n.

ben=toplam, j=1,2,…n.

ben=maks abs ( x benx j *), j=1,2,…n.

Bunlardan ilki, bir vektör uzayının Öklid normu olarak adlandırılır. Buna göre belirtilen fonksiyonun metrik olarak kullanıldığı uzaylara Öklid uzayı denir.

Genellikle, yakınlık fonksiyonu olarak tanınan görüntünün koordinatlarının karekök-ortalama farkı seçilir. x * ve standart x ben, yani işlev

ben = (1/n) toplam( x ben jx j *) 2 , j=1,2,…n.

Değer ben geometrik olarak, uzayın boyutuna bağlı olarak, özellik uzayındaki noktalar arasındaki uzaklığın karesi olarak yorumlanır.

Genellikle, farklı özelliklerin tanınmada eşit derecede önemli olmadığı ortaya çıkar. Koordinat farkının yakınlık fonksiyonlarını hesaplarken bu durumu dikkate almak için, karşılık gelen daha önemli özellikler büyük katsayılarla, daha az önemli olanlar daha küçük katsayılarla çarpılır.

Bu durumda ben = (1/n) toplam wj (x ben jx j *) 2 , j=1,2,…n,

nerede wj- ağırlık katsayıları.

Ağırlık katsayılarının tanıtılması, özellik uzayının eksenlerini ölçeklendirmeye ve buna göre alanı ayrı yönlerde germeye veya sıkıştırmaya eşdeğerdir.

Özellik uzayının bu deformasyonları, referans görüntünün noktasının yakınında her bir sınıfın önemli bir görüntü dağılımı koşulları altında en güvenilir tanımaya karşılık gelen referans görüntü noktalarının bu şekilde yerleştirilmesini amaçlar.

Özellik uzayında birbirine yakın görüntü noktalarının (görüntü kümeleri) gruplarına kümeler denir ve bu tür grupları belirleme sorununa kümeleme sorunu denir.

Kümeleri tanımlama görevi, denetimsiz örüntü tanıma görevleri olarak adlandırılır, yani. doğru tanıma örneğinin yokluğunda tanıma sorunlarına.

Diskriminant Fonksiyon Yöntemleri

Bu grubun yöntemlerinin fikri, görüntülerin uzayında sınırları tanımlayan, alanı görüntü sınıflarına karşılık gelen bölgelere bölen fonksiyonlar oluşturmaktır. Bu türden en basit ve en sık kullanılan işlevler, özelliklerin değerlerine doğrusal olarak bağlı işlevlerdir. Özellik uzayında, hiperdüzlemler biçimindeki ayırma yüzeylerine karşılık gelirler. İki boyutlu bir özellik uzayı durumunda, düz bir çizgi ayırma işlevi görür.

Doğrusal karar fonksiyonunun genel formu şu formülle verilir:

d(x)=w 1 x 1 + w 2 x 2 +…+w n x n +w n +1 = Wx+w n

nerede x- görüntü vektörü, w=(w 1 , w 2 ,…w n) ağırlık katsayılarının vektörüdür.

İki sınıfa ayrıldığında X 1 ve X 2 diskriminant işlevi d(x) kurala göre tanımaya izin verir:

x ait X 1 ise d(x)>0;

x ait X 2 ise d(x)<0.

Eğer bir d(x)=0 ise belirsizlik durumu gerçekleşir.

Birkaç sınıfa ayırma durumunda, birkaç fonksiyon tanıtılır. Bu durumda, her görüntü sınıfı, ayırt edici işlevlerin belirli bir kombinasyonu ile ilişkilendirilir.

Örneğin, üç diskriminant işlevi tanıtılırsa, görüntü sınıflarını seçmenin aşağıdaki varyantı mümkündür:

x ait X 1 ise d 1 (x)>0,d 2 (x)<0,d 3 (x)<0;

x ait X 2 ise d(x)<0,d 2 (x)>0,d 3 (x)<0;

x ait X 3 ise d(x)<0,d 2 (x)<0,d 3 (x)>0.

Diğer değer kombinasyonları için d 1 (x),d 2 (x),d 3 (x) bir belirsizlik durumu var.

Ayırt edici fonksiyonlar yönteminin bir varyasyonu, belirleyici fonksiyonlar yöntemidir. İçinde, varsa m sınıfların var olduğu varsayılır m fonksiyonlar ben(x), belirleyici olarak adlandırılır, öyle ki eğer x ait X ben, sonra ben(x) > dj(x) hepsi için j eşit değil i,şunlar. belirleyici işlev ben(x) tüm fonksiyonlar arasında maksimum değere sahiptir dj(x), j=1,...,n..

Böyle bir yöntemin bir gösterimi, görüntü noktası ile standart arasındaki özellik uzayındaki minimum Öklid mesafesinin bir tahminine dayanan bir sınıflandırıcı olabilir. Hadi gösterelim.

Tanınabilir görüntünün özellik vektörü arasındaki Öklid mesafesi x ve referans görüntünün vektörü || formülüyle belirlenir. x benx|| = 1/2 , j=1,2,…n.

Vektör x sınıfa atanacak i, bunun için || değeri x benx *|| minimum.

Mesafe yerine, mesafenin karesini karşılaştırabilirsiniz, yani.

||x benx|| 2 = (x benx)(x benx) t = x x- 2x x ben +x ben x ben

değer olduğundan beri x x herkes için aynı i, || fonksiyonunun minimumu x benx|| 2, karar fonksiyonunun maksimumu ile çakışacaktır.

ben(x) = 2x x ben -x ben x ben.

yani x ait X ben, eğer ben(x) > dj(x) hepsi için j eşit değil i.

O. minimum mesafe sınıflandırma makinesi doğrusal karar fonksiyonlarına dayanmaktadır. Böyle bir makinenin genel yapısı, formun karar fonksiyonlarını kullanır.

ben (x)=ben 1 x 1 + ben 2 x 2 +…+x n'de w +kazanç +1

Uygun blok diyagram ile görsel olarak temsil edilebilir.

Minimum mesafeye göre sınıflandırma yapan bir makine için eşitlikler gerçekleşir: w ij = -2x ben j , kazanç +1 = x ben x ben.

Diskriminant fonksiyonları fark olarak tanımlanırsa, diskriminant fonksiyonları yöntemiyle eşdeğer tanıma gerçekleştirilebilir. dij (x)=ben (x)‑dj (x).

Ayırt edici fonksiyonlar yönteminin avantajı, tanıma makinesinin basit yapısının yanı sıra, esas olarak ağırlıklı olarak doğrusal karar blokları yoluyla uygulanması olasılığıdır.

Ayırt edici fonksiyonlar yönteminin bir diğer önemli avantajı, belirli bir (eğitim) model örneğinin doğru tanınması için makinenin otomatik olarak eğitilmesi olasılığıdır.

Aynı zamanda otomatik öğrenme algoritmasının diğer tanıma yöntemlerine göre çok basit olduğu ortaya çıkıyor.

Bu nedenlerden dolayı, diskriminant fonksiyonları yöntemi geniş bir popülerlik kazanmış ve pratikte sıklıkla kullanılmaktadır.

Örüntü tanıma kendi kendine öğrenme prosedürleri

Görüntüleri iki sınıfa bölme problemine uygulanan belirli bir (eğitim) örnek için bir diskriminant fonksiyonu oluşturmaya yönelik yöntemleri düşünün. Sırasıyla A ve B sınıflarına ait iki görüntü seti verilirse, doğrusal bir diskriminant fonksiyonu oluşturma probleminin çözümü, bir ağırlık katsayıları vektörü şeklinde aranır. W=(w 1 ,w 2 ,...,w n,w n+1), herhangi bir görüntü için koşulların

x>0, ise A sınıfına aittir j=1,2,…n.

x eğer B sınıfına aitse<0, j=1,2,…n.

Eğitim örneği ise N Her iki sınıfın görüntüleri için problem, eşitsizlikler sisteminin geçerliliğini sağlayan bir w vektörü bulmaya indirgenir. N her iki sınıfın görüntüleri, problem vektörü bulmaya indirgenir w eşitsizlikler sisteminin geçerliliğini sağlayan

x 1 1 ben+x 21 w 2 +...+x n 1 w n+w n +1 >0;

x 1 2 ben+x 22 w 2 +...+x n 2 w n+w n +1 <0;

x 1 iben+x 2i w 2 +...+x ni w n+w n +1 >0;

................................................

x 1 Nben +x 2N w 2 +...+x nN w n +w n + 1>0;

burada x ben=(x ben 1 ,x ben 2 ,...,x ben n ,x ben n+ 1 ) - eğitim örneğinden görüntünün özelliklerinin değerlerinin vektörü, > işareti görüntülerin vektörlerine karşılık gelir x A sınıfına ait ve işareti< - векторам x B sınıfına ait.

istenen vektör w A ve B sınıfları ayrılabilir ise vardır ve başka türlü mevcut değildir. Vektör bileşen değerleri w ya önceden, SRO'nun donanım uygulamasından önceki aşamada veya çalışması sırasında doğrudan SRO'nun kendisi tarafından bulunabilir. Bu yaklaşımların sonuncusu, SRO'ya daha fazla esneklik ve özerklik sağlar. Bunu yüzde olarak adlandırılan bir cihaz örneğinde düşünün. 1957'de Amerikalı bilim adamı Rosenblatt tarafından icat edildi. Görüntünün iki sınıftan birine atanmasını sağlayan yüzdenin şematik bir gösterimi aşağıdaki şekilde gösterilmektedir.

Retina S Retina A Retina R

oh oh x 1

oh oh x 2

oh oh x 3

o(toplam)-------> R(reaksiyon)

oh oh x ben

oh oh x n

oh oh x n +1

Cihaz retinal duyusal elemanlardan oluşur. S retinanın birleştirici elemanlarına rastgele bağlanan A. İkinci retinanın her bir elemanı, yalnızca girişine bağlı yeterli sayıda duyu elemanı uyarılmış durumdaysa bir çıkış sinyali üretir. Tüm sistem yanıtı R birleştirici retinanın elementlerinin belirli ağırlıklarla alınan tepkilerinin toplamı ile orantılıdır.

aracılığıyla belirtmek x ben reaksiyon i birleştirici unsur ve aracılığıyla ben- reaksiyon ağırlık katsayısı i birleştirici eleman, sistemin tepkisi şu şekilde yazılabilir: R=toplam( wjxj), j=1,..,n. Eğer bir R>0, sisteme sunulan görüntü A sınıfına aittir ve eğer R<0, то образ относится к классу B. Описание этой процедуры классификации соответствует рассмотренным нами раньше принципам классификации, и, очевидно, перцентронная модель распознавания образов представляет собой, за исключением сенсорной сетчатки, реализацию линейной дискриминантной функции. Принятый в перцентроне принцип формирования значений x 1 , x 2 ,...,x n birincil sensörlerin sinyallerine dayalı özelliklerin oluşumu için belirli bir algoritmaya karşılık gelir.

Genel olarak, birkaç unsur olabilir. R algılayıcının tepkisini oluşturan. Bu durumda, algılayıcıda retinanın varlığından söz edilir. R tepki veren elementler

Yüzde şeması, retina elemanlarının sayısını artırarak, sınıf sayısının ikiden fazla olduğu duruma genişletilebilir. R yukarıdaki şekilde sunulan şemaya göre maksimum reaksiyonu belirlemek için ayırt edilebilir sınıfların sayısına ve bir bloğun eklenmesine kadar. Bu durumda resim, sınıfa numarası ile atanır. i, eğer Ri>Rj, hepsi için j.

Yüzdenin öğrenme süreci, ağırlık katsayılarının değerlerinin seçilmesinden oluşur. wj böylece çıkış sinyali tanınan görüntünün ait olduğu sınıfa karşılık gelir.

İki sınıfın nesnelerini tanıma örneğini kullanarak yüzdelik eylem algoritmasını ele alalım: A ve B. A sınıfı nesneler, değere karşılık gelmelidir. R= +1 ve B sınıfı - değer R= -1.

Öğrenme algoritması aşağıdaki gibidir.

eğer başka bir resim x A sınıfına aittir, ancak R<0 (имеет место ошибка распознавания), тогда коэффициенты wj değerlere karşılık gelen indekslerle xj>0, bir miktar artış dw, ve katsayıların geri kalanı wj azaltmak dw. Bu durumda tepkimenin değeri R doğru sınıflandırmaya karşılık gelen pozitif değerlerine doğru bir artış alır.

Eğer bir x B sınıfına aittir, ancak R>0 (tanıma hatası var), ardından katsayılar wj karşılık gelen endekslerle xj<0, увеличивают на dw, ve katsayıların geri kalanı wj aynı miktarda azaltılır. Bu durumda tepkimenin değeri R doğru sınıflandırmaya karşılık gelen negatif değerlere doğru artırılır.

Algoritma böylece ağırlık vektöründe bir değişiklik sunar. w eğer ve sadece görüntü kendisine sunulduysa k-th eğitim adımı, bu adımda yanlış sınıflandırıldı ve ağırlık vektörünü bıraktı w Doğru sınıflandırma durumunda değişiklik olmaz. Bu algoritmanın yakınsaklığının kanıtı [Too, Gonzalez]'de sunulmuştur. Bu tür bir eğitim sonunda (uygun seçimle) dw ve görüntü sınıflarının doğrusal ayrılabilirliği) bir vektöre yol açar w Doğru sınıflandırma için

İstatistiksel tanıma yöntemleri.

İstatistiksel yöntemler, bir sınıflandırma hatası olasılığını en aza indirmeye dayanır. Özellik vektörü tarafından tanımlanan, tanıma için alınan görüntünün yanlış sınıflandırılma olasılığı P x, formül tarafından belirlenir

P = toplam[ p(i)sorun( D(x)+i | x sınıf i)]

nerede m- sınıf sayısı,

p(i) = sonda ( x sınıfa ait i) - keyfi bir görüntüye ait olma olasılığı x ile i-th sınıfı (görüntülerin oluşma sıklığı i sınıf),

D(x) bir sınıflandırma kararı veren bir fonksiyondur (özellik vektörü x sınıf numarasıyla eşleşir i setten (1,2,..., m}),

prob( D(x) eşit değil i| x sınıfa ait i) olayın olasılığıdır " D(x) eşit değil i"üyelik şartı sağlandığında x sınıf i, yani fonksiyon tarafından hatalı bir karar verme olasılığı D(x) belirli bir değer için x tarafından sahip olunan i-inci sınıf.

Yanlış sınıflandırma olasılığının minimuma ulaştığı gösterilebilir. D(x)=i ancak ve ancak p(x|ip(i)>p(x|jp(j), hepsi için ben+j, nerede p(x|i) - görüntülerin dağıtım yoğunluğu iözellik alanındaki inci sınıf.

Yukarıdaki kurala göre, nokta x maksimum değere karşılık gelen sınıfa aittir p(i) p(x|i), yani görüntülerin önsel olasılığının (sıklığının) ürünü i-th sınıf ve desen dağılım yoğunluğu iözellik alanındaki inci sınıf. Sunulan sınıflandırma kuralına Bayesian denir, çünkü olasılık teorisinde iyi bilinen Bayes formülünden çıkar.

Örnek. Gürültüden etkilenen bir bilgi kanalının çıkışındaki ayrık sinyalleri tanımak gerekli olsun.

Her giriş sinyali 0 veya 1'dir. Sinyal iletimi sonucunda kanalın çıkış değeri görünür. x sıfır ortalama ve varyans ile Gauss gürültüsü ile bindirilen , b.

Sinyal tanıma gerçekleştiren bir sınıflandırıcının sentezi için Bayes sınıflandırma kuralını kullanacağız.

1 numaralı sınıfta, birimleri temsil eden sinyalleri, 2 numaralı sınıfta - sıfırları temsil eden sinyalleri birleştiririz. Önceden bilinsin ki, ortalama olarak her 1000 sinyalden a sinyaller birimlerdir ve b sinyaller - sıfırlar. Daha sonra, sırasıyla 1. ve 2. sınıfların (birler ve sıfırlar) sinyallerinin ortaya çıkmasının önsel olasılıklarının değerleri, eşit alınabilir.

p(1)=a/1000, p(2)=b/1000.

Çünkü gürültü Gauss, yani normal (Gauss) dağılım yasasına uyar, ardından değere bağlı olarak birinci sınıf görüntülerin dağılım yoğunluğu x veya aynı olan çıktı değerini elde etme olasılığı x girişte sinyal 1 uygulandığında, ifade ile belirlenir

p(x¦1) =(2pib) -1/2 exp(-( x-1) 2 /(2b 2)),

ve değere bağlı olarak dağılım yoğunluğu x ikinci sınıfın görüntüleri, yani. çıktı değerini elde etme olasılığı x girişte bir 0 sinyali uygulandığında, ifade ile belirlenir

p(x¦2)= (2pib) -1/2 exp(- x 2 /(2b 2)),

Bayes karar kuralının uygulanması, 2. sınıf bir sinyalin iletildiği sonucuna götürür, yani. eğer sıfır geçti

p(2) p(x¦2) > p(1) p(x¦1)

veya daha spesifik olarak, eğer

b tecrübe(- x 2 /(2b 2)) > a tecrübe(-( x-1) 2 /(2b 2)),

Eşitsizliğin sol tarafını sağ tarafa bölersek,

(b/a)exp((1-2 x)/(2b 2)) >1,

logaritmayı aldıktan sonra,

1-2x> 2b 2 ln(a/b)

x< 0.5 - б 2 ln(a/b)

Ortaya çıkan eşitsizlikten, a=b, yani 0 ve 1 sinyallerinin aynı a priori olasılıkları ile, görüntüye şu durumlarda 0 değeri atanır: x<0.5, а значение 1, когда x>0.5.

Sinyallerden birinin daha sık, diğerinin daha az göründüğü önceden biliniyorsa, yani. farklı değerler olması durumunda a ve b, sınıflandırıcı yanıt eşiği bir tarafa veya diğerine kaydırılır.

yani a/b=2.71 (birlerinin 2.71 kat daha sık iletimine karşılık gelir) ve b 2 =0.1, eğer görüntüye 0 değeri atanır x<0.4, и значение 1, если x>0.4. Önsel dağılım olasılıkları hakkında bilgi yoksa, Bayesian sınıflandırma kurallarının dışında kalan istatistiksel tanıma yöntemleri kullanılabilir.

Bununla birlikte, uygulamada, Bayes kurallarına dayalı yöntemler, daha yüksek verimliliklerinden ve ayrıca çoğu örüntü tanıma probleminde, her sınıfın görüntülerinin görünümü için a priori olasılıklar belirlemenin mümkün olması nedeniyle en yaygın olanıdır.

Örüntü tanımanın dilsel yöntemleri.

Dilsel örüntü tanıma yöntemleri, belirli bir dilin bir cümlesi veya cümlesi olan bir grafik veya bir sembol dizisi olarak temsil edilen idealize edilmiş bir görüntünün tanımının analizine dayanır.

Yukarıda açıklanan dilsel tanımanın ilk aşamasının bir sonucu olarak elde edilen idealleştirilmiş harfleri düşünün. Bu idealize edilmiş görüntüler, yukarıdaki örnekte yapıldığı gibi örneğin bağlantı matrisleri şeklinde temsil edilen grafiklerin açıklamaları ile tanımlanabilir. Aynı açıklama, resmi bir dil ifadesi (ifadesi) ile temsil edilebilir.

Örnek. Ön görüntü işleme sonucunda elde edilen A harfinin üç görüntüsü verilsin. Bu görüntüleri A1, A2 ve A3 tanımlayıcılarıyla atayalım.

Sunulan görüntülerin dilsel açıklaması için PDL'yi (Resim Açıklama Dili) kullanıyoruz. PDL dil sözlüğü aşağıdaki karakterleri içerir:

1. En basit görüntülerin adları (ilkel). İncelenen duruma uygulandığı gibi, ilkeller ve bunlara karşılık gelen isimler aşağıdaki gibidir.

Yönlendirilmiş bir çizgi şeklinde görüntüler:

yukarı ve sola (le F t), kuzeye (kuzey)), yukarı ve sağa (sağ), doğuya (doğu)).

İsimler: L, N, R, E.

2. İkili işlemlerin sembolleri. (+,*,-) Anlamları, ilkellerin sıralı bağlantısına (+), ilkellerin başlangıç ​​ve bitişlerinin bağlantısına (*), yalnızca ilkellerin sonlarının bağlantısına (-) karşılık gelir.

3. Sağ ve sol parantezler. ((,)) Parantezler, bir ifadede işlemlerin gerçekleştirileceği sırayı belirtmenize olanak tanır.

Göz önüne alınan görüntüler A1, A2 ve A3, sırasıyla aşağıdaki ifadelerle PDL dilinde açıklanmıştır.

T(1)=R+((R-(L+N))*E-L

T(2)=(R+N)+((N+R)-L)*E-L

T(3)=(N+R)+(R-L)*E-(L+N)

İmgenin dilsel tanımı yapıldıktan sonra, bir tanıma prosedürü kullanarak, verilen görüntünün bizi ilgilendiren sınıfa (A harfleri sınıfı), yani. Bu görüntünün bir yapıya sahip olup olmadığı. Bunu yapmak için öncelikle bizi ilgilendiren yapıya sahip olan görüntü sınıfını tanımlamak gerekir.

Açıkçası, A harfi her zaman aşağıdaki yapısal unsurları içerir: sol "bacak", sağ "bacak" ve kafa. Bu elemanları sırasıyla STL, STR, TR olarak adlandıralım.

Daha sonra, PDL dilinde A - SIMB A sembol sınıfı şu ifadeyle tanımlanır:

SIMB A = STL + TR - STR

STL'nin sol "bacağı" her zaman olarak yazılabilen bir R ve N öğeleri zinciridir.

STL -> R ¦ N ¦ (STL + R) ¦ (STL + N)

(STL, R veya N karakteri veya kaynak STL dizesine R veya N karakterleri eklenerek elde edilen bir dizedir)

STR'nin sağ "bacağı" her zaman aşağıdaki gibi yazılabilen L ve N elementlerinin bir zinciridir, yani.

STR -> L¦N¦ (STR + L)¦(STR + N)

- TR harfinin baş kısmı, E elementinden ve STL ve STR gibi zincirlerden oluşan kapalı bir konturdur.

PDL dilinde TR yapısı şu ifade ile anlatılmaktadır.

TR -> (STL - STR) * E

Son olarak, A harfleri sınıfının aşağıdaki açıklamasını alırız:

SIMB A -> (STL + TR - STR),

STL -> R¦N¦ (STL + R)¦(STL + N)

STR -> L¦N¦ (STR + L)¦(STR + N)

TR -> (STL - STR) * E

Bu durumda tanıma prosedürü aşağıdaki gibi uygulanabilir.

1. Görüntüye karşılık gelen ifade, STL + TR - STR referans yapısı ile karşılaştırılır.

2. Mümkünse STL, TR, STR yapısının her bir elemanı, yani. görüntünün tanımı standartla karşılaştırılabilir ise, T(A) ifadesinden bazı alt ifadeler eşleştirilir. Örneğin,

A1 için: STL=R, STR=L, TR=(R-(L+N))*E

A2 için: STL = R + N, STR = L, TR = ((N + R) - L) * E

A3 için: STL = N + R, STR = L + N, TR = (R - L) * E 3.

STL, STR, TR ifadeleri karşılık gelen referans yapılarıyla karşılaştırılır.

4. Her bir STL, STR, TR ifadesinin yapısı referans olana karşılık geliyorsa, görüntünün A harf sınıfına ait olduğu sonucuna varılır. İncelenen ifadenin ve referansın, görüntünün SIMB sınıfı A'ya ait olmadığı sonucuna varılmıştır. İfade yapısı eşleştirmesi, algoritmik diller olan LISP, PLANER, PROLOG ve benzeri diğer yapay zeka dilleri kullanılarak yapılabilmektedir.

İncelenen örnekte, tüm STL dizileri N ve R karakterlerinden oluşur ve STR dizileri, bu dizilerin verilen yapısına karşılık gelen L ve N karakterlerinden oluşur. İncelenen görüntülerdeki TR yapısı da referans yapıya karşılık gelir, çünkü E sembolü ile "çarpılan" STL, STR tipi dizelerin "farkından" oluşur.

Böylece, ele alınan görüntülerin sınıfa ait olduğu sonucuna varıyoruz. SIMB A.


Bulanık DC elektrikli tahrik kontrolörünün sentezi"MatLab" ortamında

Tek girişli ve çıkışlı bir bulanık denetleyicinin sentezi.

Sorun, sürücünün çeşitli girişleri doğru bir şekilde takip etmesini sağlamaktır. Kontrol eyleminin geliştirilmesi, aşağıdaki fonksiyonel blokların yapısal olarak ayırt edilebildiği bir bulanık kontrolör tarafından gerçekleştirilir: bulanıklaştırıcı, kural bloğu ve durulaştırıcı.

Şekil 4 İki dilsel değişkenli bir sistemin genelleştirilmiş işlevsel diyagramı.

Şekil 5 İki dilsel değişkenli bir bulanık denetleyicinin şematik diyagramı.

Genel durumda bulanık kontrol algoritması, aşağıdaki birbiriyle ilişkili prosedürleri kullanarak bulanık kontrolörün giriş değişkenlerinin çıkış değişkenlerine dönüştürülmesidir:

1. kontrol nesnesinden ölçüm sensörlerinden alınan girdi fiziksel değişkenlerinin bir bulanık denetleyicinin girdi dilsel değişkenlerine dönüştürülmesi;

2. denetleyicinin girdi ve çıktı dilsel değişkenleriyle ilgili dilsel kurallar olarak adlandırılan mantıksal ifadelerin işlenmesi;

3. Bulanık denetleyicinin çıktı dilsel değişkenlerinin fiziksel kontrol değişkenlerine dönüştürülmesi.

Servo sürücüyü kontrol etmek için yalnızca iki dilsel değişkenin tanıtıldığı en basit durumu ele alalım:

"açı" - giriş değişkeni;

"kontrol eylemi" - çıktı değişkeni.

Fuzzy Logic araç kutusunu kullanarak denetleyiciyi MatLab ortamında sentezleyeceğiz. Simulink'e entegre etme imkanı ile MatLab ortamında bulanık çıkarım ve bulanık sınıflandırma sistemleri oluşturmanıza olanak tanır. Bulanık Mantık Araç Kutusu'nun temel konsepti FIS yapısıdır - Bulanık Çıkarım Sistemi. FIS yapısı, Şekil 2'de gösterilen şemaya göre bulanık mantıksal çıkarıma dayalı "girişler-çıkışlar" işlevsel eşlemesinin uygulanması için gerekli tüm verileri içerir. 6.


Şekil 6. Bulanık çıkarım.

X - girdi net vektörü; - X girdi vektörüne karşılık gelen bulanık kümelerin vektörü;
- bulanık kümelerin bir vektörü biçimindeki mantıksal çıkarımın sonucu; Y - çıktı kesin vektörü.

Bulanık modül, Mamdani ve Sugeno olmak üzere iki tür bulanık sistem oluşturmanıza olanak tanır. Mamdani tipi sistemlerde bilgi tabanı, formun kurallarından oluşur. "Eğer x 1 =düşük ve x 2 =orta ise, o zaman y=yüksek". Sugeno tipi sistemlerde bilgi tabanı, formun kurallarından oluşur. “x 1 =düşük ve x 2 =orta ise, y=a 0 +a 1 x 1 +a 2 x 2 ". Dolayısıyla Mamdani ve Sugeno sistemleri arasındaki temel fark, bilgi tabanını oluşturan kurallarda çıktı değişkeninin değerlerini ayarlamanın farklı yollarında yatmaktadır. Mamdani tipi sistemlerde, çıkış değişkeninin değerleri bulanık terimlerle, Sugeno tipi sistemlerde - giriş değişkenlerinin doğrusal bir kombinasyonu olarak verilir. Bizim durumumuzda Sugeno sistemini kullanacağız, çünkü optimizasyon için kendini daha iyi ödünç verir.

Servo sürücüyü kontrol etmek için iki dilsel değişken tanıtılır: "hata" (konuma göre) ve "kontrol eylemi". Bunlardan birincisi girdi, ikincisi çıktıdır. Belirtilen değişkenler için bir terim kümesi tanımlayalım.

Bulanık çıkarımın ana bileşenleri. Bulanıklaştırıcı.

Her dilsel değişken için, tanımlanabilen bulanık kümeleri içeren formun temel bir terim kümesini tanımlarız: negatif yüksek, negatif düşük, sıfır, pozitif düşük, pozitif yüksek.

Her şeyden önce, karşılık gelen bulanık kümeler için üyelik fonksiyonlarını tanımlayan "büyük hata", "küçük hata" vb. terimlerinin ne anlama geldiğini öznel olarak tanımlayalım. Burada şimdilik, yalnızca gerekli doğruluk, giriş sinyalleri sınıfı için bilinen parametreler ve sağduyu ile yönlendirilebilir. Şimdiye kadar hiç kimse üyelik fonksiyonlarının parametrelerini seçmek için herhangi bir katı algoritma sunamadı. Bizim durumumuzda, "error" dilsel değişkeni şöyle görünecektir.

Şekil 7. Dil değişkeni "hata".

"Yönetim" dilsel değişkenini bir tablo şeklinde temsil etmek daha uygundur:

tablo 1

Kural bloğu.

Bazı durumları tanımlayan birkaç kural tanımlama sırasını düşünün:

Örneğin, çıkış açısının giriş sinyaline eşit olduğunu varsayalım (yani hata sıfırdır). Açıkçası, bu istenen durumdur ve bu nedenle herhangi bir şey yapmamıza gerek yoktur (kontrol eylemi sıfırdır).

Şimdi başka bir durumu düşünün: konum hatası sıfırdan çok daha büyük. Doğal olarak, büyük bir pozitif kontrol sinyali üreterek bunu telafi etmeliyiz.

O. resmi olarak aşağıdaki gibi tanımlanabilecek iki kural oluşturulmuştur:

eğer hata = boş, sonra kontrol eylemi = sıfır.

eğer hata = büyük pozitif, sonra kontrol eylemi = büyük pozitif.

Şekil 8. Konumda küçük bir pozitif hata ile kontrol oluşumu.

Şekil 9. Pozisyona göre sıfır hatada kontrol oluşumu.

Aşağıdaki tablo, bu basit durum için tüm durumlara karşılık gelen tüm kuralları göstermektedir.

Tablo 2

Toplamda, n girişli ve 1 çıkışlı bir bulanık kontrolör için, i-inci giriş için bulanık kümelerin sayısı nerede kontrol kuralları belirlenebilir, ancak kontrolörün normal çalışması için mümkün olan her şeyi kullanmak gerekli değildir. kurallar, ancak daha az sayıda ile idare edebilirsiniz. Bizim durumumuzda, bir bulanık kontrol sinyali oluşturmak için 5 olası kuralın tümü kullanılır.

Durulaştırıcı.

Böylece ortaya çıkan etki U, herhangi bir kuralın uygulanmasına göre belirlenecektir. Aynı anda birkaç kural yürütüldüğünde bir durum ortaya çıkarsa, sonuçta ortaya çıkan U eylemi aşağıdaki bağımlılığa göre bulunur:

, burada n, tetiklenen kuralların sayısıdır (alan merkezi yöntemiyle durulaştırma), sen bulanık kümelerin her birine karşılık gelen kontrol sinyalinin fiziksel değeridir. UBO, UMo, senZ, UMp, UBP. mUn(u) u kontrol sinyalinin ilgili bulanık kümeye ait olma derecesidir Un=( UBO, UMo, senZ, UMp, UBP). Çıktı dilsel değişkeni "güçlü" veya "zayıf" kuralın kendisiyle orantılı olduğunda durulaştırmanın başka yöntemleri de vardır.

Yukarıda açıklanan bulanık denetleyiciyi kullanarak elektrikli sürücüyü kontrol etme sürecini simüle edelim.

Şekil 10. Sistemin ortamdaki blok şemasımatlab.

Şekil 11. Ortamdaki bir bulanık denetleyicinin yapısal diyagramımatlab.

Şekil 12. Tek adımlı etkide geçici süreç.

Pirinç. 13. Bir girdi dil değişkeni içeren bulanık denetleyicili bir model için harmonik girdi altında geçici süreç.

Sentezlenmiş bir kontrol algoritmasına sahip bir sürücünün özelliklerinin analizi, bunların optimal olmaktan uzak ve diğer yöntemlerle kontrol sentezi durumundan daha kötü olduklarını gösterir (tek adım etkisi ile çok fazla kontrol süresi ve harmonik olan bir hata) . Bu, üyelik fonksiyonlarının parametrelerinin oldukça keyfi olarak seçilmesi ve kontrolör girdileri olarak sadece konum hatasının büyüklüğünün kullanılmasıyla açıklanmaktadır. Doğal olarak, elde edilen denetleyicinin herhangi bir optimalliğinden söz edilemez. Bu nedenle, kontrol kalitesinin mümkün olan en yüksek göstergelerini elde etmek için bulanık denetleyiciyi optimize etme görevi uygun hale gelir. Şunlar. görev, f(a 1 ,a 2 …a n) amaç fonksiyonunu optimize etmektir; burada a 1 ,a 2 …a n, bulanık denetleyicinin tipini ve özelliklerini belirleyen katsayılardır. Bulanık denetleyiciyi optimize etmek için Matlab ortamındaki ANFIS bloğunu kullanıyoruz. Ayrıca, denetleyicinin özelliklerini iyileştirmenin yollarından biri de girdilerinin sayısını artırmak olabilir. Bu, regülatörü daha esnek hale getirecek ve performansını artıracaktır. Bir tane daha giriş dilsel değişkeni ekleyelim - giriş sinyalinin değişim hızı (türevi). Buna göre kural sayısı da artacaktır. Daha sonra regülatörün devre şeması şu şekli alacaktır:

Şekil 14 Üç dilsel değişkenli bir bulanık denetleyicinin şematik diyagramı.

Giriş sinyalinin hızının değeri olsun. Temel terim kümesi Tn şu şekilde tanımlanır:

Тn=("negatif (VO)", "sıfır (Z)", "pozitif (VR)").

Tüm dilsel değişkenler için üyelik fonksiyonlarının yeri şekilde gösterilmiştir.

Şekil 15. Dilsel değişken "hata"nın üyelik fonksiyonları.

Şekil 16. "Giriş sinyali hızı" linguistik değişkeninin üyelik fonksiyonları.

Bir dilsel değişkenin daha eklenmesi nedeniyle, kural sayısı 3x5=15'e yükselecektir. Derlemelerinin ilkesi, yukarıda tartışılana tamamen benzer. Hepsi aşağıdaki tabloda gösterilmiştir:

Tablo 3

bulanık sinyal

yönetmek

Konum hatası

Hız

örneğin, eğer eğer hata = sıfır ve giriş sinyali türevi = büyük pozitif, sonra kontrol eylemi = küçük negatif.

Şekil 17. Üç dilsel değişken altında kontrolün oluşumu.

Girdi sayısındaki artış ve buna bağlı olarak kuralların kendisi nedeniyle, bulanık denetleyicinin yapısı da daha karmaşık hale gelecektir.

Şekil 18. İki girişli bir bulanık denetleyicinin yapısal diyagramı.

çizim ekle

Şekil 20. İki girişli dil değişkeni içeren bulanık denetleyicili bir model için harmonik girdi altında geçici süreç.

Pirinç. 21. İki giriş dil değişkeni içeren bulanık denetleyicili bir model için harmonik giriş altında hata sinyali.

Matlab ortamında iki girdili bir bulanık denetleyicinin çalışmasını simüle edelim. Modelin blok şeması, Şekil 1'deki ile tamamen aynı olacaktır. 19. Harmonik giriş için geçici sürecin grafiğinden, sistemin doğruluğunun önemli ölçüde arttığı, ancak aynı zamanda salınımının, özellikle çıkış koordinatının türevinin eğilimi olduğu yerlerde arttığı görülebilir. sıfır. Bunun nedenlerinin, yukarıda bahsedildiği gibi, hem girdi hem de çıktı dilsel değişkenleri için üyelik fonksiyonlarının parametrelerinin optimal olmayan seçimi olduğu açıktır. Bu nedenle, Matlab ortamında ANFISedit bloğunu kullanarak bulanık denetleyiciyi optimize ediyoruz.

Bulanık denetleyici optimizasyonu.

Bulanık denetleyici optimizasyonu için genetik algoritmaların kullanımını düşünün. Genetik algoritmalar, fonksiyonel optimizasyon problemlerini çözmek için son yıllarda sıklıkla kullanılan adaptif arama yöntemleridir. Biyolojik organizmaların genetik süreçlerine benzerliğe dayanırlar: biyolojik popülasyonlar, doğal seçilim yasalarına uyarak ve Charles Darwin tarafından keşfedilen "en uygun olanın hayatta kalması" ilkesine göre birkaç nesil boyunca gelişir. Bu süreci taklit ederek, genetik algoritmalar, eğer uygun şekilde kodlanırlarsa, gerçek dünya sorunlarına çözümler "geliştirebilir".

Genetik algoritmalar, her biri belirli bir soruna olası bir çözümü temsil eden bir popülasyon olan bir dizi "birey" ile çalışır. Her birey, kendisine karşılık gelen problemin çözümünün ne kadar "iyi" olduğuna göre "uygunluğu" ölçüsüne göre değerlendirilir. En uygun bireyler, popülasyondaki diğer bireylerle "çapraz üreme" yoluyla yavruları "çoğaltabilir". Bu, ebeveynlerinden miras kalan bazı özellikleri birleştiren yeni bireylerin ortaya çıkmasına neden olur. En az uygun bireylerin üreme olasılığı daha düşüktür, bu nedenle sahip oldukları özellikler popülasyondan yavaş yavaş kaybolacaktır.

Tüm yeni uygulanabilir çözümler popülasyonu, önceki neslin en iyi temsilcilerini seçerek, onları geçerek ve birçok yeni birey alarak bu şekilde yeniden üretilir. Bu yeni nesil, önceki neslin iyi üyelerinin sahip olduğu daha yüksek oranda özellikler içeriyor. Böylece nesilden nesile iyi özellikler nüfusa dağılır. Sonuç olarak, popülasyon problemin optimal çözümüne yakınsayacaktır.

Genetik algoritmalar çerçevesinde biyolojik evrim fikrini hayata geçirmenin birçok yolu vardır. Geleneksel, Şekil 22'de gösterilen aşağıdaki blok diyagram şeklinde gösterilebilir, burada:

1. İlk popülasyonun başlatılması - optimizasyon sürecinin başladığı soruna belirli sayıda çözüm üretilmesi;

2. Çaprazlama ve mutasyon operatörlerinin uygulanması;

3. Durdurma koşulları - genellikle, optimizasyon süreci, belirli bir doğrulukla soruna bir çözüm bulunana veya sürecin yakınsadığı ortaya çıkana kadar devam eder (yani, sorunun çözümünde son dönemde herhangi bir gelişme olmamıştır). N nesiller).

Matlab ortamında, genetik algoritmalar, ANFIS paketinin yanı sıra ayrı bir araç kutusu ile temsil edilir. ANFIS, Uyarlamalı Ağ Tabanlı Bulanık Çıkarım Sistemi - Uyarlamalı Bulanık Çıkarım Ağı'nın kısaltmasıdır. ANFIS, hibrit nöro-bulanık ağların ilk türevlerinden biridir - özel bir tür doğrudan sinyal yayılımına sahip bir sinir ağı. Nöro-bulanık bir ağın mimarisi, bulanık bir bilgi tabanına eşbiçimlidir. Nöro-bulanık ağlarda, üçgensel normların (çarpma ve olasılıksal VEYA) türevlenebilir uygulamaları ve düzgün üyelik fonksiyonları kullanılır. Bu, nöro-bulanık ağları ayarlamak için geri yayılım yöntemine dayalı sinir ağlarını eğitmek için hızlı ve genetik algoritmaların kullanılmasını mümkün kılar. ANFIS ağının her katmanının çalışması için mimari ve kurallar aşağıda açıklanmıştır.

ANFIS, Sugeno'nun bulanık çıkarım sistemini beş katmanlı bir ileri beslemeli sinir ağı olarak uygular. Katmanların amacı şu şekildedir: birinci katman, girdi değişkenlerinin terimleridir; ikinci katman - bulanık kuralların öncülleri (parselleri); üçüncü katman, kuralların yerine getirilme derecesinin normalleştirilmesidir; dördüncü katman, kuralların sonuçlarıdır; beşinci katman, elde edilen sonucun farklı kurallara göre bir araya getirilmesidir.

Ağ girişleri ayrı bir katmana atanmaz. Şekil 23, bir giriş değişkeni (“hata”) ve beş bulanık kural içeren bir ANFIS ağını göstermektedir. Girdi değişkeni "hata"nın dilsel değerlendirmesi için 5 terim kullanılır.


Şekil 23. YapıANFIS-ağlar.

Daha fazla sunum için gerekli olan aşağıdaki gösterimi sunalım:

Ağın girdileri olsun;

y - ağ çıkışı;

Sıra numarası r olan bulanık kural;

m - kural sayısı;

r-th kuralında (,) bir değişkenin dilsel değerlendirmesi için kullanılan üyelik fonksiyonlu bulanık terim ;

r. kuralının sonundaki reel sayılar (,).

ANFIS ağı aşağıdaki gibi çalışır.

Katman 1 Birinci katmanın her bir düğümü, çan şeklindeki üyelik fonksiyonuna sahip bir terimi temsil eder. Ağın girişleri yalnızca terimlerine bağlıdır. Birinci katmandaki düğüm sayısı, girdi değişkenlerinin terim kümelerinin kardinalitelerinin toplamına eşittir. Düğümün çıktısı, girdi değişkeninin değerinin ilgili bulanık terime ait olma derecesidir:

,

burada a, b ve c üyelik fonksiyonu yapılandırılabilir parametreleridir.

2. katmanİkinci katmandaki düğüm sayısı m'dir. Bu katmanın her bir düğümü bir bulanık kurala karşılık gelir. İkinci katmanın düğümü, karşılık gelen kuralın öncüllerini oluşturan birinci katmanın düğümlerine bağlanır. Bu nedenle, ikinci katmanın her bir düğümü 1'den n'ye kadar giriş sinyali alabilir. Düğümün çıktısı, giriş sinyallerinin çarpımı olarak hesaplanan kuralın uygulanma derecesidir. Bu katmanın düğümlerinin çıktılarını , ile belirtin.

Katman 3Üçüncü katmandaki düğüm sayısı da m'dir. Bu katmanın her bir düğümü, bulanık kuralın göreli yerine getirme derecesini hesaplar:

4. katman Dördüncü katmandaki düğüm sayısı da m'dir. Her düğüm, üçüncü katmanın bir düğümüne ve ağın tüm girişlerine bağlıdır (girişlere bağlantılar Şekil 18'de gösterilmemiştir). Dördüncü katmanın düğümü, bir bulanık kuralın ağ çıkışına katkısını hesaplar:

Katman 5 Bu katmanın tek düğümü, tüm kuralların katkılarını özetler:

.

Yalnızca türevlenebilir işlevleri kullandığından, ANFIS ağını ayarlamak için tipik sinir ağı eğitim prosedürleri uygulanabilir. Tipik olarak, geri yayılım ve en küçük kareler biçimindeki gradyan inişinin bir kombinasyonu kullanılır. Geri yayılım algoritması, kural öncüllerinin parametrelerini ayarlar, yani. üyelik fonksiyonları Kural sonuç katsayıları, ağ çıktısıyla doğrusal olarak ilişkili oldukları için en küçük kareler yöntemiyle tahmin edilir. Ayar prosedürünün her yinelemesi iki adımda gerçekleştirilir. İlk aşamada, girdilere bir eğitim örneği beslenir ve yinelemeli en küçük kareler yöntemi kullanılarak ağın istenen ve gerçek davranışı arasındaki farktan dördüncü katmanın düğümlerinin optimal parametreleri bulunur. İkinci aşamada, artık tutarsızlık ağ çıkışından girişlere aktarılır ve birinci katmanın düğümlerinin parametreleri, hata geri yayılım yöntemi ile değiştirilir. Aynı zamanda ilk aşamada bulunan kural sonuç katsayıları değişmez. İteratif ayarlama prosedürü, artık önceden belirlenmiş bir değeri geçene kadar devam eder. Üyelik fonksiyonlarını ayarlamak için hata geri yayılım yöntemine ek olarak, örneğin Levenberg-Marquardt yöntemi gibi diğer optimizasyon algoritmaları kullanılabilir.

Şekil 24. ANFISedit çalışma alanı.

Şimdi bulanık denetleyiciyi tek adımlı bir eylem için optimize etmeye çalışalım. İstenen geçici süreç yaklaşık olarak aşağıdaki gibidir:

Şekil 25. İstenen geçiş süreci.

Şekil 2'de gösterilen grafikten. maksimum hızı sağlamak için çoğu zaman motorun tam güçte çalışması ve istenen değere yaklaşırken sorunsuz bir şekilde yavaşlaması gerektiğini takip eder. Bu basit düşüncelerin rehberliğinde, aşağıda bir tablo şeklinde sunulan aşağıdaki değer örneğini eğitim olarak alacağız:

Tablo 4


Hata değeri

Yönetim değeri

Hata değeri

Yönetim değeri

Hata değeri

Yönetim değeri


Şekil 26. Eğitim seti türü.

Eğitim 100 adımda gerçekleştirilecektir. Bu, kullanılan yöntemin yakınsaması için fazlasıyla yeterlidir.

Şekil 27. Bir sinir ağını öğrenme süreci.

Öğrenme sürecinde üyelik fonksiyonlarının parametreleri, verilen bir hata değeri ile kontrolör gerekli kontrolü oluşturacak şekilde oluşturulur. Düğüm noktaları arasındaki bölümde, kontrolün hataya bağımlılığı tablo verilerinin enterpolasyonudur. Enterpolasyon yöntemi, sinir ağının nasıl eğitildiğine bağlıdır. Aslında, eğitimden sonra, bulanık denetleyici modeli, grafiği aşağıda sunulan bir değişkenin doğrusal olmayan bir işlevi olarak temsil edilebilir.

28. Regülatör içinde hatadan konuma kontrolün bağımlılığı grafiği.

Üyelik fonksiyonlarının bulunan parametrelerini kaydettikten sonra, sistemi optimize edilmiş bir bulanık kontrolör ile simüle ediyoruz.


Pirinç. 29. Bir girdi dil değişkeni içeren optimize edilmiş bulanık denetleyicili bir model için harmonik girdi altında geçici süreç.

Şekil 30. İki giriş dil değişkeni içeren bulanık denetleyicili bir model için harmonik giriş altında hata sinyali.


Grafiklerden, sinir ağını eğiterek bulanık denetleyicinin optimizasyonunun başarılı olduğu takip edilmektedir. Önemli ölçüde azaltılmış dalgalanma ve hatanın büyüklüğü. Bu nedenle, ilkesi bulanık mantığa dayanan denetleyicileri optimize etmek için bir sinir ağının kullanılması oldukça mantıklıdır. Bununla birlikte, optimize edilmiş bir kontrolör bile doğruluk gereksinimlerini karşılayamaz, bu nedenle bulanık kontrolör nesneyi doğrudan kontrol etmediğinde ve duruma bağlı olarak birkaç kontrol yasasını birleştirdiğinde başka bir kontrol yönteminin düşünülmesi tavsiye edilir.

Son on yılda, otomatik örüntü tanıma ve makine öğrenimi sistemlerinin araştırılması ve inşasına önemli bir ilgi olmuştur. Bu alanda hızlı ilerleme kaydettik. Otomatik örüntü tanıma sistemlerinin örnekleri çoktur. Dizgi ve yazılan karakterleri okumak, elektrokardiyogramları ve elektroensefalogramları işlemek, konuşulan kelimeleri tanımak, parmak izlerini tanımlamak ve fotoğrafları yorumlamak için aygıtlar ve programlar oluşturmak için başarılı girişimlerde bulunulmuştur. Diğer uygulamalar arasında karakter ve el yazısı kelime tanıma, tıbbi teşhis, sismik dalga sınıflandırması, düşman nesne tespiti, hava tahmini, bireysel mekanizmaların arıza ve arıza tespiti ve tüm üretim süreçleri yer alır. Bu bölümde, örüntü tanıma ilkelerinin başarılı uygulama bulduğu alanlarla ilgili birkaç açıklayıcı örneği ele alıyoruz.

Karakter tanıma

Otomatik model sınıflandırmasının pratik kullanımına bir örnek, optik karakter tanıma cihazları, özellikle sıradan banka çeklerinden kod karakterlerini okumaya yönelik makinelerdir.

Pirinç. 1.7. (taramaya bakın) American Bankers Association E-13B yazı tipi seti ve setin bireysel karakterlerine karşılık gelen dalga formları.

Amerika Birleşik Devletleri'nde şu anda dolaşımda olan çoğu çek, stilize edilmiş karakterler olarak Amerikan Bankacılar Birliği'nin standart E-13B yazı tipini kullanır. Şekilden aşağıdaki gibi. 1.7'ye göre bu set, okuma sürecini basitleştirmek için retina içeren alanlara özel olarak uyarlanmış 14 sembol içerir. Bu karakterler genellikle çok fazla içerik içeren özel bir baskı mürekkebi ile uygulanır.

ince öğütülmüş manyetik malzeme. Karakterler manyetik bir cihaz kullanılarak okunuyorsa, karakterleri arka plandan ayırmak ve böylece okuma işlemini kolaylaştırmak için mürekkep önceden manyetize edilir.

Karakterler tipik olarak, tek bir karakterden daha dar ve daha uzun olan tek bir yuva ile sağlanan bir okuma kafası ile yatay olarak taranır. Bir sembolü geçerken, kafa, büyüklüğü, tarama kafasının altındaki sembolün kapladığı alandaki artış hızıyla orantılı olan bir elektrik sinyali üretir. Örnek olarak, "0" sayısına karşılık gelen sinyali düşünün (Şekil 1.7). Okunan kafa soldan sağa doğru hareket ettikçe, kafanın gördüğü karakterin alanı artmaya başlar ve bu da pozitif bir türev ile sonuçlanır. Baş, sıfırın sol "rafını" terk etmeye başladığında, başın görüş alanındaki rakamın alanı azalmaya başlar ve negatif bir türev verir. Baş, sembolün orta bölgesinde olduğunda, alan sabit kalır ve türev buna bağlı olarak sıfırdır. Bu desen, şekilde gösterildiği gibi, tepe sağdaki sayı direğine ulaştığında tekrarlanır. Sembollerin şeklinin, farklı sembollere karşılık gelen sinyaller birbirinden açıkça farklı olacak şekilde seçildiğini görüyoruz. Her sinyalin uç noktalarının ve sıfırlarının, sinyalleri görüntülemek için arka plan olarak kullanılan şebekenin dikey jeneratörlerinde neredeyse tam olarak göründüğüne dikkat edilmelidir. E-13B yazı tipindeki karakterlerin şekli, doğru sınıflandırma için sadece bu noktalarda sinyal değerlerinin örneklenmesi yeterli olacak şekilde seçilmiştir. Yazı tipinin 14 karakterinin her biri için okuyucunun hafızası, yalnızca bu noktalara karşılık gelen değerleri içerir. Bir sembol sınıflandırmaya girdiğinde, sistem ona karşılık gelen sinyali hafızaya daha önce girilen sinyal standartlarıyla karşılaştırır ve ona en benzer standardın sınıfına atar. Böyle bir sınıflandırma şeması ile, ya sınıf üyelerinin numaralandırılması ilkesi ya da özelliklerin ortaklığı ilkesi kullanılmalıdır. Stilize edilmiş yazı tiplerini okumak için tasarlanmış modern cihazların çoğu benzer şekilde çalışır.

Farklı yazı tiplerini okumak için cihazların ticari versiyonları da vardır. Bu nedenle, örneğin, Recognition Equipment Incorporated tarafından geliştirilen Input 80 sistemi (Şekil 1.8), daktilo, tipografik ve el yazısı biçiminde sunulan bilgileri, doğrudan orijinal belgelerden 1'e varan bir hızla okuyabilir.

Saniyede 3600 karakter. Sistem sözlüğü modüler bir ilke üzerine kurulmuştur ve belirli bir uygulamanın gereksinimlerine göre yeniden oluşturulabilir. Tek bir yazı tipi sistemi, birçok iyi bilinen yazı tipi kümesinden birinden karakterleri okuyabilir ve çok yazı tipi sistemi, kullanıcı tarafından çeşitli geçerli yazı tipleri arasından seçilen bir dizi yazı tipiyle "eşzamanlı olarak" çalışmanıza izin verir. Bir cihaz 360'a kadar farklı karakteri tanıyabilir. Sistem ayrıca daktiloyla yazılmış sayıları okumak, daktiloyla yazılmış harfleri ve sembolleri seçmek ve basılı verileri okumak üzere yapılandırılabilir.

Pirinç. 1.8. (taramaya bakın) REI Girişi 80 Model A, Recognition Equipment Incorporated, Dallas, Texas'tan bir karakter tanıma sistemi. Şekil, sistemin aşağıdaki bileşenlerini (saat yönünde) göstermektedir: tanıma birimi, program kontrollü kontrolör, veri giriş/çıkış yazıcısı, satır yazıcısı, tanıma birimi, manyetik bant birimi ve sayfa işlemcisi. Recognition Equipment Incorporated'ın fotoğrafı.

"Input 80" REI sisteminin ana özellikleri aşağıdaki gibidir. Sayfalar, bir okuyucuya besleyen bir taşıyıcı bant üzerine seyrek bölümler ve hava püskürtücüler sistemi tarafından beslenir. Burada, yüksek frekanslı salınımlı bir ayna, okunacak karakterlere yüksek yoğunluklu bir ışık demeti odaklar; ışın, yazdırılan karakter dizisini yaklaşık 7.62 m/s'lik bir hızla geçer. İkinci, senkronize edici ayna, temsil eden ışık görüntülerini algılar.

sembolün çeşitli kısımlarını ve bunları "entegre retina" üzerine yansıtır - entegre bir devre üzerinde yapılmış bir okuyucu; yaklaşık 38.1 mm uzunluğunda tek bir silikon levha içine yerleştirilmiş 96 fotodiyottan oluşur. Bu cihaz sistemin "gözü"dür. Entegre retina, her karakteri kodlar, onu 16X12 hücre matrisi kullanarak temsil eder, karakterleri standartlaştırır, boyutlarındaki değişikliklere göre düzeltir, saniyede 3600 karaktere kadar bir hızda çalışır. İntegral retina ayrıca her bir sembolün temsilinin her hücresini 16 siyahlık seviyesinden birine ait olma durumuna göre sınıflandırır.

Okuyucunun çıktısından gelen veriler, karakter görüntüsünün tüm hücrelerinin siyahlık seviyelerinin 24 komşu hücrenin siyahlık seviyeleri ile karşılaştırıldığı tanıma birimine iletilir; bunun için uygun bir video sinyali amplifikasyon şeması kullanılır. Bu işlemin bir sonucu olarak elde edilen veriler, bir bitlik siyah beyaz bir görüntüye yol açan kuantize edilir. Bu işlem, karakterin görüntüsünü yumuşatmanıza, ince vuruşları doyurmanıza, kusurları ortadan kaldırmanıza ve gürültülü bir arka planla kontrastı artırmanıza olanak tanır. Sistem, tipografik olarak yazılan karakterleri, okunan karakter ile tanıma biriminin sözlüğünde yer alan karakterler arasındaki en küçük farkı arayarak tanır. Sistem ayrıca bulunan minimum uyumsuzluğun, başka bir sözlük sembolüyle en yakın uyumsuzluktan yeterli miktarda farklı olmasını sağlar. Sınıflandırmayı uygulamak için uygun yöntem Bölüm'de tartışılacaktır. 3.

Daktiloyla yazılan karakterlerin tanınması, farklı türde bir mantıksal prosedür kullanılarak gerçekleştirilir. Daktiloyla yazılan karakterler önceden ezberlenmiş görüntülerle eşleştirilmez, ancak kavisli, yatay ve dikey çizgiler, açılar ve kesişimler gibi belirli ortak özelliklerin varlığı açısından analiz edilir. Bu durumda, bir sembolün sınıflandırılması, içindeki belirli özelliklerin yanı sıra bunların ilişkilerinin tespiti temelinde gerçekleştirilir. Karakter tanıma sisteminin blokları şekil 2'de gösterilmiştir. 1.8, isimleri şeklin altındaki başlıkta verilmiştir.

Uzaktan alınan verilerin otomatik sınıflandırılması

Amerika Birleşik Devletleri'nde çevre kalitesine ve doğal kaynakların durumuna nispeten yeni ilgi, birçok uygulama alanına yol açmıştır.

desen tanıma. Bunlar arasında en dikkat çekeni, uzaktan alınan verilerin otomatik olarak sınıflandırılmasıdır. Uçaklara, uydulara ve uzay istasyonlarına kurulu çok bantlı spektral tarama cihazlarından elde edilen verilerin hacmi son derece büyük olduğundan, bu bilgileri işlemek ve analiz etmek için otomatik araçlara yönelmek gerekli hale geldi. Çeşitli problemlerin çözümünde uzaktan veri toplama kullanılmaktadır. Mevcut ilgi alanları arasında arazi kullanımı, mahsul değerlendirmesi, mahsul hastalık tespiti, ormancılık, hava ve su kalitesi kontrolü, jeolojik ve coğrafi araştırmalar, hava tahmini ve bir dizi başka çevresel konu yer almaktadır.

Spektral bir çalışmanın sonuçlarının otomatik sınıflandırmasına bir örnek olarak, Şekil 2'yi düşünün. 1.9, a, dünya yüzeyinin bir uçaktan çekilmiş renkli fotoğrafını gösterir. Görüntü, Indiana'nın orta bölgesinde bulunan uçuş yolu boyunca (birkaç mil) küçük bir alanı temsil ediyor. Amaç, makineye açık veya koyu toprak, nehir veya gölet suyu ve yeşil bitki örtüsü olgunlaşma aşamaları gibi farklı zemin örtüsü türlerini (sınıflar) otomatik olarak tanımayı öğretmek için yeterli veri toplamaktır.

Çok bantlı bir tarama cihazı, ışığa belirli dalga boyu bantlarıyla yanıt verir. Bahsedilen uçuşta kullanılan tarama cihazı mikron dalga boyu bantlarında çalışmaktadır. Bu aralıklar sırasıyla mor, yeşil, kırmızı ve kızılötesi bölgeleri ifade eder. Bu yöntemi kullanmak, dünya yüzeyinin bir alanı için dört görüntüye yol açar - her renk alanı için bir tane. Bu nedenle, grafiğin her noktası bir rengi temsil eden dört bileşenle karakterize edilir. Her nokta için bilgi dört boyutlu bir görüntü vektörü ile temsil edilebilir, burada morun gölgesi, yeşilin tonu vb. Belirli bir toprak katmanı sınıfına ait olan görüntü kümesi, bu sınıf için eğitim kümesini oluşturur. Bu eğitim görüntüleri daha sonra bir sınıflandırıcı oluşturmak için kullanılabilir.

Göz önünde bulundurulan uçuş sırasında elde edilen spektral verilere dayanarak, normal dağılıma uyan modeller için bir Bayes sınıflandırıcısı oluşturulmuştur (bkz. § 4.3). Şek. 1.9, b sonuçların makine çıktısını gösterir

Şekil 1'de gösterilen, dünya yüzeyinin küçük bir alanına karşılık gelen myo-o-band spektral verilerinin otomatik olarak sınıflandırılması için böyle bir sınıflandırıcının kullanılması. 1.9, bir. Oklar, özel ilgi duyulan bazı özellikleri gösterir. Ok 1 yeşil bitki örtüsünün köşesine yerleştirilir, ok 2 nehri gösterir. Ok 3, iki çıplak toprak parçasını ayıran küçük bir çiti işaret ediyor; bu nesneler çıktıda açıkça tanımlanmıştır. Aynı zamanda doğru bir şekilde tanımlanan kol, ok 4 ile işaretlenmiştir. Ok 5, renkli fotoğrafta neredeyse ayırt edilemeyen çok küçük bir gölete işaret etmektedir. Orijinal görüntüyü makine sınıflandırmasının sonuçlarıyla karşılaştırırken, ikincisinin, bir kişinin orijinal fotoğrafı görsel olarak yorumlayarak ulaşacağı sonuçlara çok yakın olduğu açıkça ortaya çıkıyor.

Biyomedikal Uygulamalar

§ 1.1'de belirtildiği gibi, tıp şu anda bilgi işlemeyle ilgili ciddi sorunlarla karşı karşıyadır. Radyograflar, elektrokardiyogramlar, elektroensefalogramlar gibi tıbbi teşhislerde kullanılan çeşitli teknik araçlar kullanılarak elde edilen verileri otomatik olarak işlemek ve hasta anketlerini analiz etmek ve yorumlamak için örüntü tanıma yöntemleri değişen derecelerde başarı ile kullanılmıştır. Çok dikkat çeken görevlerden biri, kromozomların analizi ve sınıflandırılmasının otomasyonudur.

Kromozom analizinin otomasyonuna olan ilgi, sitogenetik analizin otomasyonunun klinik teşhiste kromozom çalışmalarının kullanım olanaklarını genişleteceği gerçeğinden kaynaklanmaktadır. Ek olarak, etkisi şu anda bilinmeyen kromozom modelindeki bir dizi küçük varyasyonun patolojik etkisini değerlendirmek için geniş ölçekli önleyici popülasyon çalışmalarına olanak sağlayacaktır. Ek olarak, popülasyonun büyük gruplarını inceleme yeteneği, örneğin doğumdan önce fetüsün genel sitogenetik muayenesi ve yenidoğanların önleyici veya terapötik ihtiyacını belirlemek için bir dizi başka değerli tıbbi çalışmanın yapılmasını mümkün kılacaktır. maruz kalma, belirli bir alanda mesleki bağlantı veya ikamet etme faktörleri ile tanımlanan ve bazı zararlı etkilerden kaynaklanan artan kromozomal sapma ile karakterize edilen bireysel insan gruplarının taranması veya yeni

Pirinç. 1.10. (Tarayıcıya bakınız) Giemsa boyası ile boyanmış insan kan hücreleri, kromozomların yapısını gösteren bir müstahzar. İllüstrasyon, Pittsburgh Üniversitesi, Pittsburgh Üniversitesi Halk Sağlığı Enstitüsü'nden Dr. Niel Wald'ın izniyle.

kimyasallar ve ilaçlar, kromozomlara potansiyel tehlikeleri açısından.

Şek. 1.10, mitoz metafazında insan kan hücrelerinden hazırlanan ve Giemsa'ya göre boyanmış tipik bir preparasyonu göstermektedir. Böyle bir görüntünün analizinin en sıkıcı ve uzun kısmı, kodlama süreci ile ilişkilidir - bir doktor veya kalifiye bir laboratuvar asistanı

Her bir kromozomu ayrı ayrı sınıflandırmak zorundadır. Şekil, bazı tipik sınıflandırma gruplarına ait nesneleri göstermektedir,

Kromozomların makine sınıflandırması için birçok yöntem önerilmiştir. Şekil 2'de gösterilen kromozom tiplerinin sınıflandırılmasında etkili olduğu kanıtlanan yaklaşımlardan biri. 1.10, Bölüm'de tartışılan sözdizimsel örüntü tanıma ilkesine dayanmaktadır. 8. Bu yaklaşımın özü aşağıdaki gibidir. Uzun yaylar, kısa yaylar ve yarı düz bölümler gibi görüntünün türev olmayan öğeleri, kromozomun sınırlarını gösteren ayırt edilir. Bu ve türetilmiş öğelerin birleşimi, bazı sembollerden oluşan zincirlere veya cümlelere yol açar; ikincisi, sözde görüntülerin gramerine uygun olarak yerleştirilebilir. Her kromozom tipinin (sınıfının) kendi grameri vardır. Belirli bir kromozomu tanımlamak için bir bilgisayar onun sınırlarını takip eder ve türev olmayan öğelerden oluşan bir zincir oluşturur. İzleme algoritmasının temeli, genellikle kromozomların bitişikliği ve örtüşmesi ile ilgili zorlukları çözmenize izin veren buluşsal bir prosedürdür. Bu şekilde elde edilen zincir, bazı gramer kurallarına göre sembollerden oluşan doğru bir cümle olup olmadığını belirleyen tanıma sistemine girilir. Bu işlem belirli bir dilbilgisinin belirlenmesiyle sonuçlanırsa, kromozom o dilbilgisine karşılık gelen sınıfa atanır. Böyle bir işlem, net bir yorum elde etmeye izin vermiyorsa veya hiç başarısız olursa, sistemin bu kromozomla çalışması sonlandırılır ve operatör tarafından daha fazla analiz yapılır.

Otomatik kromozom tanıma sorununa genel bir çözüm bulunamamasına rağmen, sözdizimsel bir yaklaşım kullanan modern tanıma sistemleri, doğru yönde önemli bir adımı temsil etmektedir. § 8.5'te bu tanıma modeline geri döneceğiz ve karşılık gelen kromozomal dilbilgisini ayrıntılı olarak ele alacağız.

Parmak izi tanıma

§ 1.1'de belirttiğimiz gibi, devlet kurumlarının 200 milyondan fazla parmak izi içeren arşivleri vardır. Federal Soruşturma Bürosu'nun Kimlik Departmanı, özellikle 160 milyonun üzerinde, dünyadaki en büyük parmak izi arşivine sahiptir. Departman günlük 30.000'e kadar sorgu alıyor. Bu miktarda iş ile başa çıkmak için,

yaklaşık 1.400 teknisyen ve yetkili, yeni baskıları dikkatlice sınıflandırmalı ve ardından titizlikle eşleşmeleri aramalıdır.

FBI, birkaç yıldır otomatik parmak izi tanıma sistemi geliştirmeye ilgi gösterdi. Bu yöndeki çalışmalara bir örnek, Calspan Corporation tarafından FBI adına geliştirilen FINDER prototip sistemidir. Bu sistem, baskının karakteristik özelliklerini otomatik olarak algılar ve yerelleştirir. Sistemin algıladığı özellikler, baskıların birincil sınıflandırma sürecinde kullanılan kavisler, konturlar veya kıvrımlar gibi büyük yapısal elemanlar değil, daha çok küçük ayrıntılardır - Şekil 2'de gösterilenlere benzer olukların uçları ve dalları. 1.11.

Pirinç. 1.11. Parçalar - olukların (kareler) ve çatalların (daireler) uçları - FINDER sistemi tarafından parmak izlerini tanımlarken kullanılır. Calspan Corporation, Buffalo, NY'den Bay C. W. Swanger'ın izniyle.

Şek. 1.12, sistemin bir blok şemasını gösterir. Kısaca FINDER sisteminin işleyişi şu şekilde açıklanabilir. Operatör, baskıyı sistemin "gözüne" - tarama cihazına ileten ve baskıyı tam olarak bunun altına yerleştiren otomatik giriş cihazına standart bir boş baskı ekler. Her baskı nicelenir ve 750X750 nokta içeren bir matris ile temsil edilir, her nokta 16 olası siyahlık seviyesinden biriyle kodlanır. Tarama işlemi evrensel bir bilgisayarın kontrolü altında gerçekleştirilir. Şek. 1.13, bir yayma cihazından geçtikten sonra bir baskının nasıl bir şekil aldığını gösteren bir örnektir.

Yayma cihazının çıkışında elde edilen veriler, iki boyutlu nesnelerin paralel işlenmesi için yüksek hızlı bir algoritma kullanılarak uygulanan oluk-oluk filtresine girilir; bu algoritma 750X750 matrisinin tüm noktalarını sırayla inceler. Filtrenin çıktısı, Şekil 2'de gösterilen türde geliştirilmiş bir ikili görüntüyü yeniden üretir. 1.14. Aynı algoritma, baskının her noktasında olukların yönünü sabitler; bu bilgiler daha sonraki işlemlerde kullanılır.

(taramayı görüntülemek için tıklayın)

Baskıların çoğunu işlerken, bazı bölgelerde olukların yeterince net bir yapısını izole etmek mümkün değildir, bu da parçaları güvenilir bir şekilde algılamayı mümkün kılar. Ön-düzenleme cihazı, bu tür alanları güvenilir bilgi kaynakları olarak daha fazla analizden hariç tutar. Güvenilir parça tespiti sağlamak için beyazlık, siyahlık, çizgi eksikliği veya kontrast testleri kullanılır.

Pirinç. 1.13. Tarama cihazının çıkışında elde edilen alanın çıktısı. Bu dijital görüntüde, siyah elemanlar "0" sayısı ile ve beyaz elemanlar "15" ile temsil edilmektedir. İllüstrasyon nezaketinde Mr.

Calspan Corporation, Buffalo, New York'tan C. W. Swanger.

Baskı işlemenin bir sonraki aşaması, parçaların pratik seçimine ayrılmıştır. Bu işlem, oluk filtresinin çıkışıyla senkronize edilmiş bir algoritma kullanılarak gerçekleştirilir. Muhtemelen karakteristik özellikler olan parçaları seçer ve konumlarını ve karşılık gelen açıların büyüklüğünü kaydeder.

Parça seçim bloğunun sonuçları, son düzenleme bloğuna girilir. Her şeyden önce, seçilen parçanın alanı ve çevresi, gerçek özelliklere karşılık gelen eşik değerleri ile karşılaştırılır, bu da bilerek yanlış verileri hariç tutmayı mümkün kılar. Ardından, yinelenen özellikler hariç tutulur. Herhangi bir özel parça birden çok kez bulunursa, yalnızca bulunan parça kaydedilir.

en büyük uzunluk. Arama nesnesinin yalnızca seçilenlere bitişik parçalar olduğu bir zincirleme prosedürünün kullanılması, işlem süresini önemli ölçüde azaltır. Daha sonra, görünümü olukların yapısındaki boşluklarla ilişkili olan birbirini dışlayan parçaların ve parçaların çıkarılması. Bundan sonra, özellikler listesi, şekli ve kalitesi belirli bir eşiğin altında olan parçalardan arındırılır.

Pirinç. 1.14. Şekil 2'de sunulan verilerin atlanmasının sonuçları. 1.13, oluk oluk filtresinden geçirin. Bu durumda, siyah noktalar "g" sembolleri ile temsil edilir. İllüstrasyon, Calspan Corporation, Buffalo, NY'den Bay C. W. Swanger'ın izniyle.

Nihai düzenleme sürecinin son aşamasında, özelliğin özellik kümesine ait olup olmadığı veya karşılık gelen açının oluk yapısının yerel oryantasyonundan önemli ölçüde farklı olup olmadığı belirlenir. Küme testi, parmaktaki bir yara nedeniyle ortaya çıkanlar gibi bu tür bir grup işareti dikkate almaz. Sayısı belirli bir değeri aşan analiz edilen özelliğin yanında işaretler bulunursa, bu özellik yanlış olarak daha fazla analizden çıkarılır. Özellik son testi geçerse, sistemin mantıksal kısmı, toplanan olukların yönü hakkındaki veri setini (matris) kullanarak açının anormalliği için testin uygulanmasına geçer.

ön işleme sırasında. Oluğun ortalama açısından sapmanın büyüklüğüne bağlı olarak, işaret bırakılır, reddedilir veya sapma küçükse açı, bitişik olukların açılarının ortalama değerine göre düzeltilir.

Son olarak, son düzenleme birimi tarafından sağlanan tüm testleri geçen özellikleri temsil eden yaklaşık 2500 bitlik veri, arşivdeki baskıların özellikleri ile karşılaştırılabilmesi için manyetik bant üzerine kaydedilir.

Nükleer Reaktör Ünitelerinin Durumunun Teknik Denetiminde Örüntü Tanıma Yöntemlerinin Uygulanması

Bu son örnek, örüntü tanıma ilkelerinin nispeten yeni bir uygulama alanına aittir. Tesisin çalışmasının bütünlüğü üzerinde kontrol sağlamak için nükleer enerji tesisatlarının şemalarına çok sayıda sensör dahil edilmiştir. Özellikle kontrol ve ölçüm cihazları alanında nötron kaydedici yaygınlaşmıştır. Nötron yoğunluğunu ölçmek için tasarlanan bu cihaz, reaktörde meydana gelen mekanik titreşimlere de bağlı olan bir sinyal üretir. Bu kaydediciyi bir nükleer reaktörde kullanmanın temel amaçlarından biri, mümkün olan en erken aşamada, reaktörün normal çalışma koşullarının özelliği olmayan herhangi bir dahili salınım modunu tespit etmektir.

Şu anda, gürültü analizi alanında (nötron, akustik, termal vb.), En büyük ilgi, bir bütün olarak tesisin çalışma modunun izlenmesini sağlayan, en azından kısmen otomatikleştirilmiş bu tür teknik kontrol sistemlerinin oluşturulmasıdır. ve normdan sapma ile ilişkili olmayan mod değişikliklerine uyum sağlama yeteneğine sahiptir. Kontrol sistemleri, yararlı olması için bazı sistematik prosedürler kullanılarak işlenmesi gereken büyük hacimlerde bilgi üretir. Bu, şu anda gerçek bir zorluk teşkil etmese de, bu yazının yazıldığı sırada Amerika Birleşik Devletleri'nde 50'den fazla nükleer santral faaliyette bulunmadığından, Atom Enerjisi Komisyonu 2000 yılına kadar bu tür santrallerin sayısının tek başına Amerika Birleşik Devletleri'nde 1.000'i aşacaktır. Doğal olarak, bu tür nükleer santrallerin bir parçası olacak çok sayıda kontrol sistemi tarafından üretilen bilgilerin otomatik olarak işlenmesi için yöntemler oluşturmak gerekli olacaktır.

kurulumlar. Bu alandaki tanınma ilk adımlarını henüz atmaya başlasa da, potansiyelleri zaten tam olarak tanımlanmıştır. Aşağıda bu yönde elde edilen başlıca sonuçları kısaca açıklıyoruz.

Pirinç. 1.15 Otomatik gürültü analiz sisteminin ana bileşenleri.

Şek. 1.15, otomatik kontrol sisteminin ana bileşenlerini gösterir. Bir nükleer santralde kurulu sensörlerden gelen gürültüyü temsil eden sinyaller normalleştirilir, ön işleme tabi tutulur ve örüntü tanıma sistemine girilir. Bu sistemin çıkışında, kurulumun mevcut durumunu karakterize eden bir çözüm üretilir. Bizim durumumuzda, izotop üretimi için tasarlanmış yüksek nötron akı yoğunluğuna sahip bir nükleer reaktörden bahsediyoruz: reaktör, Oak Ridge Ulusal Laboratuvarı'na (Oak Ridge Ulusal Laboratuvarı) kurulur. Günde ortalama üç kez gerçekleştirilen nötron gürültüsü ölçümlerinin sonuçları, bu reaktörün rejimini izlemek için başlangıç ​​verileri olarak kullanılır. Tam güçte çalışırken yakıt döngüsü (yakıt pilinin yeniden doldurulması arasındaki süre) tipik olarak 22 gündür. Bu verilere dayanarak, ön işleme ünitesi, 1 Hz aralıklarla 0 ila 31 Hz frekans aralığında güç spektral yoğunluğunu belirler. Bu nedenle, her ölçümün sonuçları 32 boyutlu bir görüntü vektörü ile temsil edilebilir , burada 0 Hz frekansında radyasyonun spektral güç yoğunluğunun genliği, 1 Hz frekansındaki genlik vb. Görev bu durumda, benzer görüntüleri otomatik olarak analiz edebilen bir örüntü tanıma sistemi oluşturmaktır.

Yüksek nötron akı yoğunluğuna sahip bir izotop reaktörünün iki yakıt çevrimi için veriler, Şekil 3'te üç boyutlu bir koordinat sisteminde gösterilmektedir. 1.16, a ve b. Eksen yakıt çevrim süresini karakterize eder, y ekseni 32 bileşeni temsil eder

ve z ekseni, güç spektral yoğunluğunun normalleştirilmiş genliğidir. Verilen veriler normal çalışma içindir. Her iki veri grubunun da genellikle çok benzer olduğunu unutmayın.

Pirinç. 1.16. İzotop üretimi için tasarlanmış yüksek nötron akı yoğunluğuna sahip bir nükleer reaktörün normal çalışmasına karşılık gelen tipik nötron güç spektral yoğunlukları. Grafiklerin her birindeki en büyük tepe noktaları 1 değerine karşılık gelir. Spektral yoğunluğun gerçek değerleri, grafikten elde edilen değerlerin uygun ölçeklendirme faktörleri ile çarpılmasıyla elde edilebilir. Onlar eşit: . Gonzalez, Fry ve Kreiter'den uyarlanan grafikler, IEEE Trans. çekirdek Sk., 21, hayır. 1 Şubat 1974 (R.C. Gonzales, D.N. Fry, R.C. Kryter, Model Tanıma Yöntemlerinin Nükleer Reaktör Çekirdek Bileşeni Gözetlemesinde Uygulanmasındaki Sonuçlar).

Yüksek nötron akı yoğunluğuna sahip bir izotop reaktörünün modunu kontrol etmek için tasarlanmış bir tanıma sistemi, uygun işleme tabi tutulan nötron gürültü kayıtlarından normal çalışma modunun karakteristik özelliklerini çıkarır. Bu prosedür, temel olarak, bir kümeleme algoritmasını arka arkaya uygulayarak görüntü vektörlerinin kümelerini bulmaya indirgenir (ilgili yöntemler Bölüm 3'te tartışılmıştır). Kümelerin merkezlerinin konumunu karakterize eden veriler ve ayrıca bireysel kümeler için karşılık gelen tanımlayıcı saçılım tipi istatistikler, daha sonra, mevcut durumu tanımlamak için ölçüm sonuçlarıyla herhangi bir zaman noktasında karşılaştırma için karşılaştırma ölçütü olarak kullanılabilir. kurulum durumu. Belirtilen özelliklerden önemli sapmalar

normal çalışma sırasında anormal bir sürecin meydana geldiğinin göstergeleri olarak hizmet eder. Şek. 1.17, a ve b, örneğin, normal çalışma modundan keskin bir şekilde farklı olarak kolayca sınıflandırılabilen reaktörün davranışını gösterir. Verilen veriler, reaktör çekirdeğinin yakınında bulunan mekanik ünitelerden birinin kılavuz yatağının arızalanması durumuna karşılık gelmektedir. Belirlenen sapmalar acil bir tehlike oluşturan bir durum yaratmasa da, bu tür sonuçlar, bir nükleer santralin durumunun teknik denetimini sağlayan bir önlemler sisteminin ayrılmaz bir parçası olarak örüntü tanıma yöntemlerinin kullanılmasının potansiyel önemini göstermektedir. Bu konuyla ilgili ek ayrıntılar Gonzalez, Fry ve Kreiter'in makalesinden toplanabilir.

Pirinç. 1.17. İzotop üretmek için tasarlanmış yüksek nötron akışı yoğunluğuna sahip bir nükleer reaktörün anormal davranışına karşılık gelen spektral yoğunluklar. Bu durumda ölçek faktörleri şunlardır: . Gonzalez, Fry ve Kreiter'den uyarlanan grafikler, IEEE Trans. çekirdek Sk., 21, hayır. 1 Şubat 1974 (R.C. Gonzalez, D.N. Fry, R.C. Kryter, Model Tanıma Yöntemlerinin Nükleer Reaktör Çekirdek Bileşeni Gözetlemesinde Uygulanmasındaki Sonuçlar).


Ve işaretler. Bu tür görevler, örneğin trafik ışıklarında bir caddeyi geçerken veya sürerken oldukça sık çözülür. Yanan bir trafik ışığının rengini tanımak ve yolun kurallarını bilmek, o anda karşıdan karşıya geçip geçmeme konusunda doğru kararı vermenizi sağlar.

Biyolojik evrim sürecinde birçok hayvan, görsel ve işitsel aparatların yardımıyla sorunları çözdü. desen tanıma yeterince iyi. Yapay sistemlerin oluşturulması desen tanıma zor bir teorik ve teknik problem olmaya devam etmektedir. Bu tür bir tanıma ihtiyacı, askeri ilişkiler ve güvenlik sistemlerinden her türlü analog sinyalin sayısallaştırılmasına kadar çeşitli alanlarda ortaya çıkmaktadır.

Geleneksel olarak, görüntü tanıma görevleri yapay zeka görevlerinin kapsamına dahildir.

Örüntü tanımada yönergeler

İki ana yön vardır:

  • Canlıların sahip olduğu tanıma yeteneklerinin incelenmesi, açıklanması ve modellenmesi;
  • Uygulamalı problemlerde bireysel problemleri çözmek için tasarlanmış aygıtları oluşturmak için teori ve yöntemlerin geliştirilmesi.

Sorunun resmi ifadesi

Örüntü tanıma, temel olmayan verilerin toplam kütlesinden bu verileri karakterize eden temel özellikleri vurgulayarak başlangıç ​​verilerinin belirli bir sınıfa atanmasıdır.

Tanıma problemlerini kurarken, temelin deney yoluyla bir sonuç elde etmek olduğu yapay sinir ağları teorisinden farklı olarak matematiksel dili kullanmaya, deneyi mantıksal akıl yürütme ve matematiksel kanıtlarla değiştirmeye çalışırlar.

Çoğu zaman, tek renkli görüntüler örüntü tanıma problemlerinde göz önünde bulundurulur ve bu da bir görüntüyü bir düzlemde bir fonksiyon olarak düşünmeyi mümkün kılar. Bir düzlemde ayarlanmış bir noktayı ele alırsak T, işlev nerede x(x,y) görüntünün her noktasında özelliklerini ifade eder - parlaklık, şeffaflık, optik yoğunluk, o zaman böyle bir işlev görüntünün resmi bir kaydıdır.

Tüm olası işlevler kümesi x(x,y) yüzeyde T- tüm görüntülerin setinin bir modeli var X. Konseptin tanıtılması benzerlikler Görüntüler arasında tanıma görevini ayarlayabilirsiniz. Böyle bir ortamın özel biçimi, şu veya bu yaklaşıma göre tanımanın sonraki aşamalarına büyük ölçüde bağlıdır.

Örüntü tanıma yöntemleri

Optik görüntü tanıma için, bir nesnenin görünümü üzerinde farklı açılarda, ölçeklerde, ofsetlerde vb. yineleme yöntemini uygulayabilirsiniz. Harfler için yazı tipi, yazı tipi özellikleri vb. üzerinde yineleme yapmanız gerekir.

İkinci yaklaşım, nesnenin konturunu bulmak ve özelliklerini (bağlanabilirlik, köşelerin varlığı vb.)

Diğer bir yaklaşım ise yapay sinir ağlarını kullanmaktır. Bu yöntem, tanıma görevinin çok sayıda örneğini (doğru cevaplarla) veya bu görevin özelliklerini dikkate alan özel bir sinir ağı yapısını gerektirir.

Bir örüntü tanıma yöntemi olarak Perceptron

F. Rosenblatt, görevi, yapısı ve işlevsel özellikleri bilinen bazı fiziksel sistemlerde psikolojik fenomenlerin nasıl ortaya çıkabileceğini göstermek olan bir beyin modeli kavramını tanıtan - en basitini tanımladı. ayrım deneyleri. Bu deneyler tamamen örüntü tanıma yöntemleriyle ilgilidir, ancak çözüm algoritmasının deterministik olmamasıyla farklılık gösterir.

Belirli bir sistem hakkında psikolojik olarak önemli bilgiler elde etmenin mümkün olduğu en basit deney, modelin iki farklı uyaranla sunulduğu ve bunlara farklı şekillerde yanıt vermesi gerektiği gerçeğine dayanır. Böyle bir deneyin amacı, deneycinin müdahalesi olmadan sistem tarafından kendiliğinden ayrım yapma olasılığını incelemek veya tersine, deneycinin sisteme işlemi gerçekleştirmeyi öğretmeye çalıştığı zorunlu ayrımcılığı incelemek olabilir. gerekli sınıflandırma

Bir öğrenme deneyinde, bir algılayıcıya genellikle, ayırt edilecek sınıfların her birinin temsilcilerini içeren belirli bir görüntü dizisi sunulur. Bazı bellek değiştirme kuralına göre doğru tepki seçimi pekiştirilir. Daha sonra kontrol uyaranı algılayıcıya sunulur ve bu sınıfa ait uyaranların doğru tepkiyi alma olasılığı belirlenir. Seçilen kontrol uyaranının eğitim dizisinde kullanılan görüntülerden biriyle eşleşmesine veya eşleşmemesine bağlı olarak farklı sonuçlar elde edilir:

  • 1. Kontrol uyaranı herhangi bir öğrenme uyaranı ile uyuşmuyorsa, deney yalnızca saf ayrımcılık, aynı zamanda öğeleri de içerir genellemeler.
  • 2. Kontrol uyaranı, aynı sınıftan daha önce sunulan uyaranların etkisi altında etkinleştirilen öğelerden tamamen farklı belirli bir duyusal öğe kümesini uyarıyorsa, deney bir çalışmadır. saf genelleme .

Algılayıcıların saf genelleme kapasitesi yoktur, ancak özellikle kontrol uyaranı, algılayıcının zaten bir miktar deneyim biriktirdiği kalıplardan biriyle yeterince yakından eşleşiyorsa, ayrım deneylerinde oldukça tatmin edici bir şekilde işlev görürler.

Örüntü tanıma sorunlarına örnekler

  • Harf tanıma.
  • Barkod tanıma.
  • Plaka tanıma.
  • Yüz tanıma.
  • Konuşma tanıma.
  • Görüntü tanıma.
  • Maden yataklarının bulunduğu yer kabuğunun yerel alanlarının tanınması.

Örüntü tanıma programları

Ayrıca bakınız

notlar

Bağlantılar

  • Yuri Lifshits. Kurs "Teorik Bilişimin Modern Sorunları" - örüntü tanıma, yüz tanıma, metin sınıflandırma istatistiksel yöntemleri üzerine dersler
  • Örüntü Tanıma Araştırması Dergisi (Örüntü Tanıma Araştırması Dergisi)

Edebiyat

  • David A. Forsyth, Jean Pons Bilgisayar görüşü. Modern Yaklaşım = Bilgisayarla Görü: Modern Bir Yaklaşım. - E.: "Williams", 2004. - S. 928. - ISBN 0-13-085198-1
  • George Stockman, Linda Shapiro Bilgisayarla görme = Bilgisayarla Görme. - M.: Binom. Bilgi Laboratuvarı, 2006. - S. 752. - ISBN 5947743841
  • A.L. Görelik, V.A. Skripkin, Tanıma yöntemleri, M.: Lise, 1989.
  • Ş.-K. Çeng, Görsel bilgi sistemlerinin tasarım ilkeleri, M.: Mir, 1994.

Wikimedia Vakfı. 2010 .

Teknolojide, bir nesnenin (konu, süreç, fenomen, durum, sinyal) aşağıdakilerden birine ait olduğunu belirlemek için yöntemlerin geliştirilmesi ve sistemlerin (bilgisayar temelinde dahil) oluşturulmasıyla ilgili bilimsel ve teknik bir yön. ön ... ... Büyük Ansiklopedik Sözlük

Yeni bölgelerden biri sibernetik. R. teorisinin içeriği hakkında. birkaç sınıfa ait nesnelerin (görüntülerin) özelliklerinin, bir anlamda kendilerine yakın olan nesnelere ekstrapolasyonudur. Genellikle, bir otomat R. hakkında öğretirken. var ... ... Jeolojik Ansiklopedi

ingilizce tanıma, görüntü; Almanca Gestalt alterkennung. Onları karakterize eden sonlu bir dizi özellik tarafından tanımlanan nesneleri sınıflandırmak ve tanımlamak için ilke ve yöntemler geliştiren matematiksel sibernetiğin bir dalı. Antinazi. Ansiklopedi ... ... Sosyoloji Ansiklopedisi

Desen tanıma- bilgisayar yardımıyla karmaşık nesneleri inceleme yöntemi; özelliklerin seçiminden ve bilgisayarların nesneleri bu özelliklere göre otomatik olarak sınıflandırmasına izin veren algoritmaların ve programların geliştirilmesinden oluşur. Örneğin, hangisini belirlemek için ... ... Ekonomik ve Matematiksel Sözlük

- (teknik), bir nesnenin (konu, süreç, fenomen, durum, sinyal) aşağıdakilerden birine ait olduğunu belirlemek için yöntemlerin geliştirilmesi ve sistemlerin (bilgisayar tabanlı olanlar dahil) oluşturulmasıyla ilgili bilimsel ve teknik bir yön. ön ... ... ansiklopedik sözlük

DESEN TANIMA- nesneleri, fenomenleri, süreçleri, sinyalleri, sonlu bir dizi belirli özellik veya özellik tarafından tanımlanabilen tüm bu nesnelerin durumlarını sınıflandırmanın yanı sıra tanımlama yöntemleri geliştiren bir matematiksel sibernetik bölümü, ... ... Rus sosyolojik ansiklopedisi

desen tanıma- 160 model tanıma: Otomatik araçlar kullanarak form temsillerinin ve konfigürasyonların tanımlanması