Programlama öğreticileri - sayfa 13

 

Faktöriyeller, Permütasyonlar ve Kombinasyonlar


Faktöriyeller, Permütasyonlar ve Kombinasyonlar

Herkese merhaba, bugün faktöriyeller, permütasyonlar ve kombinasyonlar dahil olmak üzere sayma kavramlarını keşfedeceğiz. Her şey, bir olay M şekilde gerçekleşebiliyorsa ve ikinci olay N şekilde gerçekleşebiliyorsa, o zaman sıradaki iki olayın toplamda M çarpı N şekilde gerçekleşebileceğini belirten temel sayma ilkesine iner. Daha da önemlisi, ilk olayın sonucu, ikinci olay için olası sonuçların sayısını etkilemez.

Bir örnekle başlayalım. Bir menünün 6 salata ve 8 çorba içerdiğini varsayalım. Kaç tane çorba ve salata kombinasyonu mümkündür? İlk önce bize 6 olasılık veren bir salata seçiyoruz. Bu seçeneklerin her biri için 8 olası çorba vardır. Bu nedenle, toplam 48 olası kombinasyonla sonuçlanan 8'li 6 grup elde ediyoruz.

Bu fikir, daha uzun olay dizilerine kadar uzanır. Örneğin bir menüde 6 salata, 8 çorba, 15 ana yemek ve 3 tatlı varsa, 6 çarpı 8 çarpı 15 çarpı 3 yani 2.160 olası öğün vardır.

Bazen nesnelerin, insanların veya nesnelerin kaç farklı şekilde düzenlenebileceğini saymamız gerekir. Örneğin 4 kişilik bir grup kaç farklı şekilde sıraya girebilir? Temel sayma ilkesini tekrar kullanabiliriz. Sıradaki 1. kişi için 4, 2. kişi için 3, 3. kişi için 2, 4. kişi için 1 seçenek bulunmaktadır. Bu sayıları çarparsak, 4 kere 3 kere 2 kere 1 olduğunu buluruz ki bu da 24 kişiye eşittir. Bu hesaplama o kadar yaygın ki, ona özel bir isim veriyoruz: faktöriyel.

Genel olarak, N! olarak gösterilen bir N sayısının faktöriyeli, ilk N pozitif tamsayının çarpımıdır. Örneğin, 3! 1 çarpı 2 çarpı 3, 5! 1 çarpı 2 çarpı 3 çarpı 4 çarpı 5, vb. Faktöriyel, üstel büyümeden bile daha hızlı büyür. Örneğin, 10! zaten 3 milyondan fazla.

Biraz daha karmaşık bir örnek ele alalım. 12 atın bir yarışa girdiğini varsayalım ve biz onların kaç farklı şekilde kazanabileceklerini, yerleştirebileceklerini ve gösterebileceklerini, yani ilk üç sırayı bilmek istiyoruz. Temel sayma ilkesini bir kez daha uygulayabiliriz. 12 olası kazanan, 11 olası ikinci sırada bitiren ve 10 olası üçüncü sırada bitiren vardır. Bu sayıları çarptığımızda 12 çarpı 11 çarpı 10 olduğunu ve bunun sonucunda 1.320 olası kombinasyon elde ettiğimizi buluruz.

Bunu genelleştirmek için, N öğemiz olduğunu ve ilk K öğe için düzenleme sayısını saymak istediğimizi varsayalım. Temel sayma ilkesini kullanarak, ilk öğe için N seçenek, ikinci öğe için N - 1 seçenek vardır ve toplamda K terim elde edene kadar böyle devam eder. Son terim N - K + 1 olacaktır. Bunu N faktöriyelin (N - K) faktöriyele bölünmesine eşit olan NPK olarak gösteriyoruz.

Sıralarına bakmaksızın K nesne gruplarını seçebileceğimiz yolların sayısını saymak istediğimizde başka bir durum ortaya çıkar. Buna kombinasyonlar denir. Örneğin, bir yarıştaki on iki attan üçü uyuşturucu testi için rastgele seçilirse, atlar kaç farklı şekilde seçilebilir? Bu durumda sıra önemli değil. Sıra dikkate alınmadan toplam N şey arasından K şeyin seçilebileceği yolların sayısını temsil eden NCk gösterimini kullanıyoruz. Bunu hesaplamak için, N seç K = NPK /(K faktöriyel) formülünü kullanırız. Verilen örnekte, 12 seç 3'ü hesaplamamız gerekiyor. Bunu yapmak için biraz cebirsel işlem uygulayabiliriz. 12 seçim 3'ü 12 permute 3 bölü 3 faktöriyel olarak yeniden yazabiliriz. Daha da basitleştirirsek, elimizde 12 var! / (12 - 3)! * 3!. Hesaplamaları yaptıktan sonra 12 seçim 3'ün 220'ye eşit olduğunu bulduk. Bu nedenle, rastgele uyuşturucu testi için 12 attan 3'ünü seçmenin 220 yolu vardır.

Genel olarak, N seçim K'yi N faktöriyeli bölü (N - K) faktöriyel çarpı K faktöriyel olarak ifade edebiliriz. Bu formül, çeşitli senaryolar için kombinasyon sayısını hesaplamamızı sağlar.

Permütasyonlar ve kombinasyonlarla uğraşırken sorulması gereken can alıcı soru, düzenin önemli olup olmadığıdır. Sıra önemliyse, bu bir permütasyon problemidir. Sıra önemli değilse, bu bir kombinasyon sorunudur.

Birkaç örneği inceleyelim. Diyelim ki yirmi kişilik bir sınıftan dört kişilik bir komite oluşturmak istiyoruz. Bu durumda seçim sırası önemli değil, dolayısıyla 20 seç 4'ü hesaplamamız gerekiyor. Formülü kullanarak 20 seç 4'ün 20'ye eşit olduğunu buluyoruz! / (20 - 4)! * 4!, 48.845'e sadeleşir. Bu nedenle, yirmi öğrencilik sınıftan dört kişilik bir komite oluşturmanın 48.845 yolu vardır.

Şimdi başka bir senaryoyu ele alalım. Dört kişilik komitenin bir başkan, başkan yardımcısı, sekreter ve sayman içermesi gerekiyorsa, seçim sırası önemlidir. Burada 20 permüte 4 yani 20'yi hesaplamamız gerekiyor! / (20 - 4)!. Hesaplamaları yaptıktan sonra 116.280 olası düzenleme olduğunu görüyoruz.

Biraz farklı bir durumda, yirmi kişilik bir sınıftan dört kişilik bir komite oluşturulması ve bir kişinin başkan olarak atanması gerektiğini varsayalım. Bu, iki adım içeren karma bir problemdir. İlk olarak, 20 farklı şekilde yapılabilen başkanı seçiyoruz. Ardından, sıranın önemli olmadığı komitenin kalan üç üyesini seçiyoruz. Bu da 19 seç 3'e karşılık gelir. Dolayısıyla toplam olasılık sayısı 20'dir (19 seç 3). Bunu hesapladıktan sonra 19.382 olası sonuç olduğunu görüyoruz.

Özet olarak, permütasyonlar ve kombinasyonlar, olayların meydana gelebileceği veya nesnelerin düzenlenebileceği yolların sayısını saymayı içerir. Sıranın önemli olup olmadığını anlamak, sorunu çözmek için uygun yöntemi belirlemede çok önemlidir. Temel sayma ilkesini uygulayarak ve permütasyon ve kombinasyon formüllerini kullanarak, çeşitli senaryolardaki olasılıkları etkili bir şekilde sayabiliriz.

Factorials, Permutations, and Combinations
Factorials, Permutations, and Combinations
  • 2020.07.04
  • www.youtube.com
Let's learn to count. Factorials, permutations, and combinations all rely on the terribly important Fundamental Counting Principle. Make it your friend! If t...
 

Koşullu Olasılık ve Çarpma Kuralı


Koşullu Olasılık ve Çarpma Kuralı

Herkese merhaba, bugün koşullu olasılık kavramını ve çarpma kuralını inceleyeceğiz. Koşullu olasılık fikrini bir örnekle açıklayarak başlayalım.

Bir araştırmada, bir araştırmacı 1.250 yetişkinle iletişime geçti ve her birine köpekleri mi yoksa kedileri mi tercih ettiklerini sordu. Başlamak için, bu örneklemden köpekleri tercih eden bir katılımcıyı rastgele seçme olasılığını hesaplayalım. 1.250 katılımcıdan köpekleri tercih eden 589 kişi var. Bu nedenle, köpekleri tercih eden birini rastgele seçme olasılığı 589/1.250'dir, bu da 0,471 veya %47,1'e eşittir.

Şimdi, 55 yaşın üzerindeki bir katılımcının kedileri köpekleri tercih etme olasılığını hesaplayalım. Tabloda "55+" etiketli sütuna odaklanıyoruz. Bu sütunda toplam 325 kişiden köpek tercih eden 143 yetişkin bulunmaktadır. Bu nedenle, o sütundan köpekleri tercih eden birini rastgele seçme olasılığı 143/325'tir, bu yaklaşık %0,44 veya %44'tür.

İki olasılığın aynı olmadığına dikkat edin. Bu, A olayının meydana geldiğini zaten bildiğimizde B olayının meydana gelme olasılığı olarak tanımlanan koşullu olasılık kavramını vurgular. Örneğimizde, yalnızca B olayının olasılığını (köpekleri tercih eden) değil, aynı zamanda A verilen B'nin olasılığını da hesapladık (cevaplayanın 55 yaşın üzerinde olduğu göz önüne alındığında köpekleri tercih eden).

Koşullu olasılığı içeren başka bir örneği ele alalım. Bir kart destemiz var ve ondan değiştirilmeden iki kart çekiliyor. Çekilen ilk kart papaz ise, çekilen ikinci kartın da papaz olma olasılığını bulmak istiyoruz. Burada iki olayımız var: A, çekilen ilk kartın papaz olması olayı ve B, ikinci kartın papaz olması olayı.

İlk olay gerçekleşirse (bir papaz çekeriz), şimdi geriye üçü papaz olan 51 kartımız kalır. Bu nedenle, ikinci bir papaz çekme olasılığı 3/51'dir, bu yaklaşık olarak %0,059 veya %5,9'dur. Bu olasılığın, 4/52 veya 0,077 olan ilk kartın papaz olma olasılığından farklı olduğuna dikkat etmek önemlidir.

Koşullu olasılık, A ve B olmak üzere iki olayın meydana gelme olasılığını hesaplamak istediğimizde özellikle yararlıdır. İşte burada çarpma kuralı devreye giriyor. A ve B olaylarının her ikisinin de sırayla meydana gelme olasılığı şu formülle verilir: P(A ve B) = P(A) × P(B|A). İlk olayın meydana gelme olasılığının, ikinci olayın olma olasılığı ile çarpımı olarak yorumluyoruz, ilk olayın zaten olduğunu varsayıyoruz.

Örneğin, standart bir desteden değiştirmeden iki papaz çekme olasılığını hesaplayalım. İlk kartın papaz olma olasılığı 4/52, ikinci kartın papaz olma olasılığı ise 3/51'dir. Bu olasılıkları birlikte çarparak, her iki kartın da papaz olma olasılığının yaklaşık olarak %0,0045 veya %0,45 olduğunu buluruz.

Şimdi, bir müşterinin bir restoranda alkol ve meze sipariş ettiği senaryoyu ele alalım. Bir müşterinin alkol sipariş etme olasılığının (A olayı) %40, meze sipariş etme olasılığının (B olayı) %30 ve hem alkol hem meze sipariş etme olasılığının (A ve B olayları) olduğunu gözlemledik. %20

Müşterinin bir meze sipariş etmesi koşuluyla alkol sipariş etme olasılığını hesaplamak için (P(A|B)) çarpma kuralını kullanabiliriz. Verilen değerleri yerine koyarsak P(A ve B) = %20, P(B) = %30 elde ederiz. Çarpma kuralı formülünü yeniden düzenleyerek P(A|B) için çözebiliriz:

P(A|B) = P(A ve B) / P(B)

Verilen değerleri yerine koyarsak, P(A|B) = %20 / %30 = 2/3 veya yaklaşık olarak 0,667 olur. Bu nedenle, bir müşterinin meze sipariş ettiği düşünülürse alkol sipariş etme olasılığı üçte ikidir.

Benzer şekilde, müşterinin alkol sipariş etmesi koşuluyla meze sipariş etme olasılığını hesaplayalım (P(B|A)). Yine çarpma kuralını kullanarak şunu elde ederiz:

P(B|A) = P(A ve B) / P(A)

Verilen değerleri yerine koyarsak, P(B|A) = %20 / %40 = 1/2 veya 0,5 olur. Bu nedenle, alkol sipariş eden bir müşterinin meze sipariş etme olasılığı yarı yarıyadır.

Bu iki koşullu olasılığın farklı olduğunu ve alkol siparişi ile meze siparişi olaylarının bağımlı olduğunu belirtmek önemlidir. P(A|B)'nin P(A)'ya eşit olmaması ve P(B|A)'nın P(B)'ye eşit olmaması gerçeği, bir olayın meydana gelip gelmediğini bilmenin diğer olayın meydana gelme olasılığı hakkında bilgi sağladığını gösterir.

Şimdi, listelenen olay çiftlerinin bağımsız olup olmadığını belirlemek için birkaç örnek inceleyelim:

  1. Her iki ebeveyninizde de şeker hastalığı varsa şeker hastası olmak: Bu olaylar bağımlıdır. Her iki ebeveynde de diyabet varsa, bireyin diyabet olma olasılığı artar. Bununla birlikte, bireyin diyabet geliştireceği kesin değildir ve aile öyküsü olmadan diyabet geliştirmek hala mümkündür.

  2. Standart bir zarın ilk atışında beş ve ikinci atışta dört gelmesi: Bu olaylar bağımsızdır. İlk atışın sonucu, ikinci atışın sonucu hakkında herhangi bir bilgi sağlamaz. Hilesiz bir zarda beş ve dört atma olasılığı her olay için 1/6'dır.

  3. Sigara içmek ve akciğer kanserine yakalanmak: Bu olaylar bağımlıdır. Sigara içmek akciğer kanseri gelişme olasılığını artırır. Ancak bu kesin değil ve sigara içmeyen kişilerde de akciğer kanseri gelişebilir.

  4. Standart bir desteden değiştirilmeden çekilen iki kart ve her iki kart da as: Bu olaylar bağımlıdır. İkinci kartın as gelme olasılığı çekilen ilk kartın as olup olmamasına bağlıdır. Her iki kartın da as olma olasılığı, ilk kartın as olma olasılığından daha düşüktür.

  5. Değiştirilerek standart bir desteden çekilen iki kart ve her iki kart da as: Bu olaylar bağımsızdır. İlk çekilişten sonra kartı değiştirmek, ilk karttan elde edilen herhangi bir etkiyi veya bilgiyi ortadan kaldırır. As çekme olasılığı her iki kart için de aynı kalır.

Genel olarak, bir olayın meydana gelme olasılığı, diğer olayın meydana gelme olasılığı, olayın bağımsız olarak meydana gelme olasılığına eşitse, iki olay bağımsız kabul edilir. Olasılıklar farklı olduğunda, olaylar bağımlıdır.

Son olarak, bir restorandaki siparişlerin doğruluğunu inceleyen bir yöneticiyi içeren bir senaryoyu inceleyelim. Yönetici, olasılıkları belirlemek için farklı öğünler ve günün saatleri için 960 siparişi inceler.

Soru 1: Bu veri setinden rastgele seçilen bir sıranın doğru doldurulma olasılığı şu şekilde hesaplanabilir: Toplam 960 emirden 842 tanesi doğru doldurulmuştur. Böylece, olasılık yaklaşık olarak %0,877 veya %87,7'ye eşit olan 842/960'tır.

Soru 2: Rastgele seçilen bir yemek siparişinin doğru doldurulma olasılığını bulmak için koşullu olasılığı ele alıyoruz. Yemek siparişleri arasında toplam 280 yemek siparişinden 249 adet doğru doldurulmuş sipariş bulunmaktadır. Bu nedenle, olasılık yaklaşık %0,889 veya %88,9 olan 249/280'dir.

Soru 3: Rastgele doğru bir sipariş seçmenin rastgele bir akşam yemeği siparişi seçmekten bağımsız olup olmadığını belirlemek için, koşullu olasılık P(A|B) ile P(A) olasılığını karşılaştırıyoruz. Bu durumda, P(A|B) 0,889'dur (bir önceki soruda hesaplandığı gibi) ve P(A) 0,877'dir (ilk sorudan). İki olasılık eşit olmadığından, rastgele doğru bir sipariş seçmenin rastgele bir yemek siparişi seçmekten bağımsız olmadığı sonucuna varabiliriz.

Bu örnekte, verilen veri setine dayalı olarak olasılıkların hesaplanmasını içeren klasik olasılığı dikkate aldığımızı not etmek önemlidir. Bu değişkenlerin gelecekteki gözlemlerinin bağımsız olup olmayacağı sorusu daha karmaşıktır ve ki-kare testi gibi istatistiksel analiz gerektirir. Olayların bağımsızlığının ampirik olarak belirlenmesi, rastgele değişkenliğin varlığının değerlendirilmesini ve daha büyük bir örneklem boyutunun analiz edilmesini içerir.

Conditional Probability and the Multiplication Rule
Conditional Probability and the Multiplication Rule
  • 2020.09.20
  • www.youtube.com
How does information about the probability of one event change the probability of another event? Let's get into it! If this vid helps you, please help me a t...
 

Rastgele Değişkenlere Giriş


Rastgele Değişkenlere Giriş

Herkese merhaba, bugün rastgele değişkenler kavramını inceleyeceğiz. Rastgele bir değişken, sürecin sonucunun sayısal bir değerle temsil edildiği bazı olasılıksal süreçler üzerinde tanımlanan bir değişkendir. Daha iyi anlamak için birkaç örneği inceleyelim.

İki zar atma ve toplamlarını alma senaryosunu düşünün. Zarların toplamı rastgele bir değişken olarak kabul edilebilir. Başka bir örnek, bir madeni parayı 50 kez atmak ve tura sayısını saymaktır. Bu deneyde elde edilen kafa sayısı da rastgele bir değişkendir. Benzer şekilde, Chicago şehrinde rastgele seçilen bir kişinin tam boyunu ölçmek veya Old Faithful şofbeninin püskürme uzunluğunu ölçmek, rastgele değişkenlere örnektir.

Olasılığa dayalı bir deneyin tüm sonuçlarının rastgele değişkenler olmadığına dikkat etmek önemlidir. Örneğin, bir köpek barınağında rastgele seçilen bir yavru köpeğin cinsiyeti veya rastgele seçilmiş bir ABD senatörünün göz rengi, rastgele değişkenler kategorisine girmeyen sonuçlardır. Sayısal olmadıkları ve rastgele değişkenleri tanımlamadıkları için kategorik verilerdir.

İki temel rasgele değişken türü vardır: kesikli ve sürekli. Sürekli rasgele değişkenler, bir patlamanın tam uzunluğu veya rasgele seçilen bir kişinin tam boyu gibi belirli bir aralıkta değerlerini alır. Bu değerler, istenen herhangi bir doğruluk düzeyinde kesirler ve ondalık sayıları içerebilir. Ayrık rastgele değişkenler ise 1, 2, 3, 4 veya 5 gibi ayrı ayrı listelenebilen değerlere sahiptir.

Rastgele bir değişkenin sınırlı sayıda olası sonucu olduğunda, tüm bu sonuçları karşılık gelen olasılıklarıyla birlikte listeleyen bir tablo oluşturabiliriz. Bu tabloya ayrık olasılık dağılımı denir. Üç kez yazı tura attığımız ve elde edilen tura sayısını saydığımız bir örneği ele alalım. Olası sonuçlar 0, 1, 2 veya 3 turadır ve her sonuca olasılıklar atarız. Örneğin, 8'de 1 ihtimalle tura gelmeme olasılığı vardır ve olasılıklar buna göre azalır veya artar.

Ayrık bir olasılık dağılımı oluşturmak, veriler kullanılarak da yapılabilir. Amerika Birleşik Devletleri'nde 100 yetişkinden oluşan rastgele bir örneklem üzerinde anket yaptığımızı ve onlara haftada kaç kez dışarıda akşam yemeği yediklerini sorduğumuzu ve 0 ile 5 arasında değişen yanıtlar aldığımızı varsayalım. 100 olan toplam örneklem büyüklüğüne göre o kategorideki insan sayısı. Bu, rastgele değişkenin tüm olası sonuçlarını (dışarıda yemek yeme sayısı) ilgili olasılıklarıyla birlikte gösteren bir olasılık dağılımıyla sonuçlanır.

Ayrık olasılık dağılımlarını görsel olarak temsil etmek için olasılık histogramları çizebiliriz. Önceki örnekle devam ederek, x ekseninde 0, 1, 2, 3, 4 ve 5 kategorileri ve çubukların yükseklikleri olarak karşılık gelen olasılıkları içeren bir histogram oluşturabiliriz. Örneğin geçen hafta dışarıda sıfır öğün yeme olasılığı 0,49 ise x=0 kategorisi için 0,49 yüksekliğinde bir çubuk çizeriz. Bu olasılık histogramının şekli, aynı veriler için bir frekans dağılım histogramının şekli ile aynı olacaktır.

Özetle, rastgele değişkenler olasılık deneylerinin sonuçlarını temsil eden sayısal değerlerdir. Ayrık veya sürekli olabilirler. Ayrık rasgele değişkenlerin sınırlı sayıda olası sonucu vardır ve bunların olasılıkları, ayrı bir olasılık dağılımı kullanılarak temsil edilebilir. Olasılık histogramları, ayrı olasılık dağılımlarını görsel olarak tasvir etmek ve farklı sonuçların olasılığını anlamak için kullanışlıdır.

An Introduction to Random Variables
An Introduction to Random Variables
  • 2020.04.30
  • www.youtube.com
What is a random variable? What are the different types? How can we quantify and visualize them? If this vid helps you, please help me a tiny bit by mashing ...
 

R'deki Olasılık Histogramları


R'deki Olasılık Histogramları

Herkese merhaba! Bugün, qplot komutunu kullanarak R'de güzel olasılık histogramları oluşturma sürecini keşfedeceğiz. Bir iki örnek üzerinden ilerleyelim.

İlk örneğimizde, ilgili olasılıklarıyla birlikte 1'den 6'ya kadar değerler alabilen, X adında ayrı bir rasgele değişkenimiz var. Başlamak için, verileri girelim ve R'de histogramı oluşturalım.

1'den 6'ya kadar değerler alabilen X değişkenini tanımlayarak başlıyoruz. Bunu gerçekleştirmek için kısaltılmış iki nokta üst üste operatörünü, 1:6 kullanabiliriz. Şimdi, X değişkenimiz 1, 2, 3, 4, 5 ve 6 değerlerini içeriyor.

Ardından, karşılık gelen olasılıkları depolamak için bir vektör oluşturuyoruz. Bu durumda 1, 2, 3, 4, 5 ve 6 değerlerinin olasılıkları sırasıyla 0,15, 0,1, 0,1, 0,4, 0,2 ve 0,05'tir. Olasılıkların sırasının karşılık gelen değerlerin sırası ile eşleşmesi gerektiğine dikkat etmek önemlidir.

Verileri doğru girdiğimizden emin olmak için tüm olasılıkların toplamını hesaplayarak hızlı bir kontrol yapabiliriz. Meşru bir ayrık olasılık dağılımımız varsa, toplam her zaman 1 olmalıdır. Bu durumda, toplam gerçekten de 1'dir ve verilerin doğru girildiğini gösterir.

Şimdi olasılık histogramını oluşturalım. qplot işlevini kullanacağız ve x ekseni için X değişkenini belirleyeceğiz. Ayrıca, yükseklik argümanı olarak sağladığımız olasılıkları kullanarak değerlerin nasıl ağırlıklandırılacağını R'ye bildirmemiz gerekir. Son olarak, bu durumda bir histogram olan grafik tipini belirtiyoruz.

Histogramı oluşturduğumuzda çubukların birbirine değmediğini fark ediyoruz. Bir olasılık histogramında, bitişik değerler, ilişkilerini gösteren, birbirine değen çubuklara sahip olmalıdır. Bunu düzeltmek için, sahip olduğumuz değer sayısıyla aynı olacak şekilde bölme sayısını belirtebiliriz. Bu durumda, altı değerimiz var, bu yüzden kutu sayısını altı olarak ayarladık.

Artık histogram şekillenmeye başlıyor. Ancak görsel çekiciliğini artırmak için çubuklar arasına biraz ayrım ekleyebiliriz. Bunu, çubuklar için bir sınır rengi belirleyerek elde ederiz. Bu örnekte siyah rengi kullanıyoruz.

İkinci örneğe geçerek olasılık histogramı oluşturma işlemine devam ediyoruz. Bu sefer elimizde 15, 16, 18, 19 ve 20 değerlerini alabilen Y adında bir rasgele değişkenimiz var. Ayrıca, 0 olduğu için olasılığı 0 olan 17 dışında bu değerler için karşılık gelen olasılıklarımız var. olası bir sonuç değil.

Verileri girerek ve qplot işlevini kullanarak histogramı oluşturarak öncekiyle aynı adımları izliyoruz. Ancak, bu sefer Y eşittir 17'de boş bir kova olduğunu fark ediyoruz, bu da sıfır olasılığını gösteriyor. Bu bilgiyi doğru bir şekilde elde etmek için, Y eşittir 17'de boş bir kutuya izin veren altı kutu kullanmak istiyoruz.

Çubuklar için bir sınır rengi ve bir iç renk ekleyerek histogramın estetiğini daha da geliştirebiliriz. Örneğin, sınır rengini koyu mavi ve dolgu rengini normal mavi olarak ayarlayabiliriz. Ek olarak, y ekseni etiketini olasılıkları temsil ettiğini gösterecek şekilde özelleştirebilir ve x ekseni etiketini, bu soyut bir veri kümesi olduğundan yalnızca "değerler" olarak değiştirebiliriz.

Bu ayarlamalarla olasılık histogramımız daha profesyonel görünüyor. Elbette, istenen görsel sunumu elde etmek için renkleri ve etiketleri ince ayarlamaya devam edebiliriz. R'de zarif bir olasılık histogramını bu şekilde oluşturuyoruz.

Probability Histograms in R
Probability Histograms in R
  • 2020.09.11
  • www.youtube.com
Constructing attractive probability histograms is easy in R. In this vid, we use the qplot() command in the ggplot2 package.If this vid helps you, please hel...
 

Ayrık Rastgele Değişkenlerle Çalışma


Ayrık Rastgele Değişkenlerle Çalışma

Herkese merhaba! Bugün, ayrık rasgele değişkenler ve ayrık olasılık dağılımları kavramını keşfedeceğiz. Rastgele değişken, değeri rastgele bir süreçle belirlenen bir değişkendir. Ayrı bir rasgele değişken durumunda, olası sonuçlar listelenebilir ve bu da ayrı bir olasılık dağılımıyla sonuçlanır.

Bu kavramı açıklamak için bir örnek ele alalım. 16 odalı bir evimiz olduğunu ve sahip olduğu pencere sayısını saymak için rastgele bir oda seçtiğimizi hayal edin. Pencerelerin sayısı 0, 1, 2, 3 veya 4 olabilir ve her birinin karşılık gelen olasılıkları 3/16, 5/16 vb. Bu, tüm olası sonuçlardan ve bunlarla ilişkili olasılıklardan oluşan ayrık bir olasılık dağılımını temsil eder.

Ayrık rastgele değişkenlerin ve ayrık olasılık dağılımlarının iki önemli özelliği vardır. İlk olarak, tüm olasılıkların toplamı bire eşit olmalıdır. Bu, olasılıklar olası tüm sonuçları kapsadığından, bir şeyin her zaman olmasını sağlar. Örneğimizde, tüm olasılıkları toplarsak 16/16 veya bir elde ederiz.

İkinci olarak, kesikli olasılık dağılımlarıyla uğraşırken olasılıklar eklenebilir. Örneğin, X'in 3 veya 4 olma olasılığını bulmak istiyorsak, X'in 3 olma olasılığını ve X'in 4 olma olasılığını hesaplayabilir ve sonra bunları bir araya getirebiliriz. Bu durumda olasılık 3/16 + 1/16 = 4/16 = 1/4'tür.

Birkaç örnek problemle devam edelim. Beş olası sonucu olan bir Y rasgele değişkenini içeren başka bir ayrık olasılık dağılımı düşünün: 5, 10, 25, 50 ve 200. Bize bu sonuçlardan dördü için olasılıklar verildi ve beşinci sonucun olasılığını bulmamız gerekiyor.

Tüm olasılıkların toplamı bire eşit olması gerektiğinden, eksik olasılığı çıkarabiliriz. Birden bilinen olasılıkların toplamını (0,04 + 0,12 + 0,18 + 0,45) çıkararak, Y'nin 200 olma olasılığının 0,21 olduğunu buluruz.

Şimdi, aynı kesikli olasılık dağılımını kullanarak birkaç hesaplama yapalım. İlk olarak, Y'nin 10'dan küçük veya 10'a eşit olma olasılığını bulmak istiyoruz. Bu, Y'nin 5'e ve Y'nin 10'a eşit olma olasılıklarının toplanmasını içerir, bu da 0.04 + 0.12 = 0.16 ile sonuçlanır.

Sonra, Y'nin tek sayı olma olasılığıyla ilgileniyoruz. Bu durumda iki sonucumuz var: Y eşittir 5 ve Y eşittir 25. Bunların olasılıklarını toplayarak 0.04 + 0.18 = 0.22 elde ederiz.

Son olarak, Y'nin 5'ten büyük olma olasılığını belirleyelim. Y'nin 10, 25, 50 ve 200'e eşit olma olasılıklarını doğrudan toplamak yerine, bir kestirme yol kullanabiliriz. Tamamlayıcı olayı ele alıyoruz: Y'nin 5'ten büyük olmama olasılığı. Y'nin 5'ten küçük veya 5'e eşit (0,04) olma olasılığını 1'den çıkararak, 1 - 0,04 = 0,96 elde ederiz.

Bu örnekler, olasılıkların nasıl hesaplanacağını ve ayrık olasılık dağılımları bağlamında tamamlayıcı olayların nasıl kullanılacağını göstermektedir.

Working with Discrete Random Variables
Working with Discrete Random Variables
  • 2020.04.30
  • www.youtube.com
Let's solve some problems using discrete probability distributions!
 

Rastgele Değişkenler: Ortalama, Varyans ve Standart Sapma


Rastgele Değişkenler: Ortalama, Varyans ve Standart Sapma

Herkese merhaba! Bugün, rastgele değişkenleri ve bunların merkezi eğilim ve yayılma ölçülerini, yani ortalama, varyans ve standart sapmayı tartışacağız. Bir rastgele değişkenin merkezini ve yayılımını, sayısal verilerde yaptığımıza benzer bir şekilde tanımlayabiliriz.

Ayrık bir olasılık dağılımı örneğini ele alalım. İnsanlara önceki hafta dışarıda yedikleri akşam yemeği sayısını rastgele sorduğumuz bir anket yaptığımızı hayal edin. Dağılım, yanıt verenlerin yaklaşık %49'unun dışarıda yemek yemediğini, yaklaşık %22'sinin bir kez dışarıda yemek yediğini vb. gösteriyor. Bu dağılımı bir olasılık histogramı kullanarak görselleştirebiliriz. Histogramı gözlemleyerek, bu rastgele değişkenin merkezini ve yayılımını tartışmak sezgiseldir.

Daha spesifik olmak gerekirse, bulgularımızı histograma göre yorumlayalım. Bir rasgele değişkenin beklenen değeri veya ortalaması, rasgele değişkenin her bir değerinin karşılık gelen olasılıkla çarpılması ve sonuçların toplanmasıyla belirlenir. Bu ağırlıklı ortalama, rastgele değişkenin merkezini temsil eder. Önceki ayrık olasılık dağılımımıza atıfta bulunarak, her bir değeri (0, 1, 2, vb.) ilgili olasılıkla (0,49, 0,22, vb.) çarparak ve ürünleri toplayarak beklenen değeri hesaplıyoruz. Bu durumda beklenen değer 1,12'dir.

Beklenen değer genellikle, veri analizinde popülasyon ortalamasına benzer olan μ olarak gösterilir. Rastgele değişkenin merkezini ölçer. Olasılık histogramına bakıldığında, beklenen değer, histogramın bir dayanak noktasında dengeleneceği denge noktasını temsil eder.

Şimdi, varyans ve standart sapma kullanılarak ölçülen ayrı bir rasgele değişkenin yayılmasını tartışalım. Varyans, rastgele değişkenin her bir değerinden ortalamanın çıkarılması, sonucun karesinin alınması, karşılık gelen olasılıkla çarpılması ve tüm ağırlıklı varyansların toplanmasıyla hesaplanır. Bu, her bir değerin ortalamadan ne kadar saptığını yakalar. Ancak, farkların karesini aldığımız için ortaya çıkan varyans, orijinal verilerle aynı birimlere sahip olmayacaktır. Aynı ölçekte bir ölçüme sahip olmak için varyansın karekökünü alırız ve bize standart sapmayı veririz.

Uygulamada, elle hesaplama varyansı ve standart sapma külfetli olabilir. İstatistiksel yazılım veya hesap makineleri gibi teknolojilerin kullanılması tavsiye edilir. Örneğin, R programlamasında, değerleri ve bunlara karşılık gelen olasılıkları girebilir, ardından beklenen değeri, varyansı ve standart sapmayı hesaplamak için yerleşik işlevleri kullanabiliriz.

Teknolojiyi kullanarak, verimli bir şekilde hesaplamalar yapabilir ve çarpımlar ve kareler içeren manuel hesaplamalardan kaçınabiliriz. Varyans, hesaplamalar ve teorik değerlendirmeler için değerli içgörüler sağlarken standart sapma, orijinal rasgele değişkenle aynı birimleri paylaştığı için yorumlama için daha uygundur.

Özetle, rastgele değişkenlerle uğraşırken, merkezlerini (ortalama) ve dağılımlarını (varyans ve standart sapma) anlamak çok önemlidir. Bu ölçümler, rastgele değişkenin özelliklerini verimli bir şekilde ölçmemize ve yorumlamamıza izin verir.

Random Variables: Mean, Variance, and Standard Deviation
Random Variables: Mean, Variance, and Standard Deviation
  • 2020.05.02
  • www.youtube.com
If this vid helps you, please help me a tiny bit by mashing that 'like' button. For more #rstats joy, crush that 'subscribe' button!
 

Bernoulli Denemeleri ve Binom Dağılımı


Bernoulli Denemeleri ve Binom Dağılımı

Herkese merhaba, bugün Bernoulli denemelerinden ve binom dağılımından bahsedeceğiz. Bir Bernoulli denemesi, iki sonucu olan basit bir olasılık deneyidir: başarı ve başarısızlık. Bu denemeler, küçük harf "p" ile gösterilen başarı olasılığı ile tanımlanır. Bu kavramı açıklamak için bazı örneklere bakalım.

Örneğin, yazı tura atmak ve tura gelmeyi başarı olarak kabul etmek, 1/2'ye eşit bir başarı olasılığına (p) sahip olacaktır. Standart 52 kartlık bir desteden bir kart çekmek ve bir ası başarı olarak kabul etmek, 4/52 veya 1/13'e eşit bir başarı olasılığına (p) sahip olacaktır. Amerikan seçmenlerinin %40'ı başkanlarını onaylarsa, rastgele bir seçmen seçmenin başarı olasılığı (p) 0,4'e eşit olacaktır.

"Başarı" ve "başarısızlık" terimlerinin bu bağlamda teknik terimler olduğunu ve herhangi bir siyasi ifade veya kişisel görüşü ima etmediğini belirtmek önemlidir. Başarıyı 1 ve başarısızlığı 0 olarak kodlayarak Bernoulli denemelerini ayrık rasgele değişkenler olarak gösterebiliriz. Bu, x'in 0 veya 1 değerleri alarak basit bir olasılık dağılımı oluşturmamızı sağlar. 0 alma olasılığı 1 - p'ye eşittir çünkü bu sonuçlar tamamlayıcıdır.

Bu rasgele değişkenin (x) beklenen değerini, x'in tüm olası değerleri için karşılık gelen olasılıkla (p(x)) çarpı x'i toplayarak hesaplayabiliriz. Beklenen değer, tek bir denemede başarı olasılığını temsil eden p'ye eşittir. Benzer şekilde, x'in tüm olası değerleri için (x - beklenen değer)^2 ile p(x) çarpımını toplayarak varyansı hesaplayabiliriz. Varyans, p(1 - p)'ye eşittir. Varyansın karekökünü almak bize rastgele değişkenin yayılmasını ölçen standart sapmayı verir.

Birçok durumda, Bernoulli denemeleri art arda gerçekleştirilir ve n adet aynı ve bağımsız denemede toplam başarı sayısıyla sonuçlanır. Bu, 0'dan n'ye kadar değerler alabilen ayrı bir rasgele değişkene yol açar. Tipik olarak B(n, p) olarak gösterilen binom dağılımı, başarı olasılığı p olan n özdeş ve bağımsız Bernoulli denememiz olduğunda bu rastgele değişken için olasılık dağılımını temsil eder.

Örneğin, adil bir madeni para üç kez atılırsa ve x'i tura sayısı olarak tanımlarsak, binom dağılımı olarak B(3, 0,5) elde ederiz. Tüm olası sonuçları ve bunlara karşılık gelen olasılıkları göz önünde bulundurarak x'in her değeri için olasılıkları doğrudan hesaplayabiliriz. n büyüdükçe, bu olasılıkları elle hesaplamak pratik olmaz ve daha genel bir formüle ihtiyacımız olur.

k'nin 0 ile n arasında değiştiği n denemede tam olarak k başarı olasılığı, n seç k çarpı p^k çarpı (1 - p)^(n - k) formülüyle verilir. Bu formül, n denemede tam olarak k başarıya ulaşmanın yollarının sayısını ve ilgili olasılıkları açıklar. Binom dağılımında olasılıkları verimli bir şekilde hesaplamamızı sağlar.

Bir basketbolcunun ortalama serbest atış başarı oranının %78 olduğu bir örneği ele alalım. Eğer on serbest atış atarsa, tam olarak sekiz atış ve en az sekiz atış yapma olasılığını hesaplamak için binom dağılımını kullanabiliriz. Değerleri formüle yerleştirerek, olasılıkları buna göre hesaplayabiliriz.

Binom dağılımına sahip rastgele bir değişken, birden fazla Bernoulli denemesinin toplamıdır. Bu rasgele değişkenin ortalaması n çarpı p ile, varyansı ise n çarpı p çarpı (1 - p) ile verilir. Standart sapma, np çarpı (1 - p) kareköküdür.

Başarı olasılığı 0,78 olan basketbolcunun on atış yapması durumunda, beklenen değer (ortalama) 10 * 0,78 = 7,8 ve standart sapma (10 * 0,78 * (1 - 0,78)'nin karekökü olacaktır. )) ≈ 1.3.

Binom dağılımını görselleştirmek için bir olasılık histogramı oluşturabiliriz. Başarı olasılığı 0,78 olan on atış yapan bir basketbolcunun örneğini alarak, 0'dan 10'a kadar her bir x değerini (başarılı atış sayısı) temsil eden çubuklarla bir histogram oluştururuz. on denemede belirli sayıda atış. Örneğin tam 8 atış yapma olasılığı 0,3 civarında olacaktır.

Binom dağılımı, sabit bir başarı olasılığı ile tekrarlanan bağımsız denemeleri içeren durumları analiz etmek için yararlı bir çerçeve sağlar. Beklenen değer, varyans ve olasılık hesaplamaları gibi binom dağılımının özelliklerini anlayarak, istatistik, finans ve kalite kontrol dahil olmak üzere çeşitli alanlarda bilinçli kararlar ve tahminler yapabiliriz.

Binom dağılımının, bağımsız denemeler ve her deneme için sabit bir başarı olasılığı gibi belirli koşulları varsaydığını unutmayın. Binom dağılımını gerçek dünya senaryolarına uygularken bu varsayımlar dikkatle değerlendirilmelidir.

Sonuç olarak, Bernoulli denemeleri ve binom dağılımı, iki sonuçlu ve birden çok bağımsız denemeli olasılık deneyleri hakkında temel bir anlayış sunar. Bu kavramlarla ilişkili formülleri ve özellikleri kullanarak, çeşitli senaryolarda farklı başarı seviyelerine ulaşma olasılıklarını analiz edebilir ve tahmin edebiliriz.

Bernoulli Trials and The Binomial Distribution
Bernoulli Trials and The Binomial Distribution
  • 2020.08.03
  • www.youtube.com
Your life will get so much better once you understand the binomial distribution. If this vid helps you, please help me a tiny bit by mashing that 'like' butt...
 

R'de Binom Hesaplamaları


R'de Binom Hesaplamaları

Herkese merhaba, bugün binom dağılımını içeren hesaplamaları yapmak için R'yi kullanacağız. R'de, binom dağılımıyla çalışmak için bilinmesi önemli olan dört temel fonksiyon vardır.

İlk olarak, rbinom() işlevi, binom dağılımından rasgele değerler üretir. Üç argüman alır: üretilecek rasgele değerlerin sayısı, örneklem büyüklüğü ve bireysel bir denemede başarı olasılığı. Örneğin, rbinom(10, 2, 0,5), örneklem büyüklüğü 2 ve başarı olasılığı 0,5 olan bir binom dağılımından 10 rasgele değer üretir.

İkincisi, dbinom() işlevi, iki terimli dağılımda belirli sayıda başarı elde etme olasılığını döndürür. Üç argüman alır: başarı sayısı, örneklem büyüklüğü ve başarı olasılığı. Aynı anda farklı başarı sayılarına ilişkin olasılıkları hesaplamak için başarı sayısını bir vektör olarak belirleyebilirsiniz. Örneğin, dbinom(0:4, 4, 0.5), örneklem büyüklüğü 4 ve başarı olasılığı 0,5 olan bir binom dağılımında 0, 1, 2, 3 veya 4 başarı elde etme olasılıklarını hesaplar.

Daha sonra, pbinom() işlevi kümülatif bir olasılık işlevidir. Binom dağılımında en fazla belirli sayıda başarı elde etme olasılığını döndürür. Dbinom()'a benzer şekilde, kümülatif olasılıkları hesaplamak için bir değerler vektörü sağlayabilirsiniz. Örneğin, pbinom(0:4, 4, 0,5), örneklem büyüklüğü 4 ve başarı olasılığı 0,5 olan bir binom dağılımında en fazla 0, 1, 2, 3 veya 4 başarı elde etme olasılıklarını döndürür.

Son olarak, qbinom() işlevi bir ters olasılık hesaplayıcısıdır. Kümülatif olasılığın belirli bir olasılığa eşit veya daha büyük olduğu şekilde başarıların en küçük değerini döndürür. Başka bir deyişle, binom dağılımındaki nicelikleri hesaplar. Örneğin, qbinom(c(0,25, 0,5, 0,75), 10, 0,5), örnek boyutu 10 ve başarı olasılığı 0,5 olan bir binom dağılımında 25., 50. ve 75. yüzdelikleri verir.

Şimdi bu fonksiyonları bazı problemlere uygulayalım.

Problem 1: 10 kez adil bir zar attığımız ve altıları saydığımız bir deneyin 50 turunu simüle edelim. Örnek boyutu 10 ve başarı olasılığı 1/6 olan rbinom() işlevini kullanabiliriz (çünkü 1/6'lık bir altı atma şansı vardır).

results <- rbinom ( 50 , 10 , 1 / 6 ) table ( results )

Sorun 2: Son zamanlarda yapılan bir araştırmaya göre, Amerikalıların %72'si köpekleri kedilere tercih ediyor. Rastgele 8 Amerikalı seçilirse, tam olarak 6 tanesinin köpekleri tercih etme ve 6'dan azının köpekleri tercih etme olasılığı nedir? dbinom() ve pbinom() fonksiyonlarını kullanabiliriz.

# Probability of exactly 6 preferring dogs
prob_six <- dbinom ( 6 , 8 , 0.72 ) # Probability of fewer than 6 preferring dogs
prob_less_than_six <- pbinom ( 5 , 8 , 0.72 )
prob_six
prob_less_than_six

Sorun 3: Ağırlıklı bir madeni paranın tura gelme olasılığı %42'dir. 5 atışta beklenen tura sayısı nedir? Ayrıca, 5 atıştaki tura sayısını temsil eden rastgele değişken için bir olasılık histogramı oluşturun.

Beklenen kafa sayısını hesaplamak için, örnek büyüklüğünün ve başarı olasılığının ürünü olan bir binom dağılımının beklenen değeri formülünü kullanabiliriz. Bu durumda, örneklem büyüklüğü 5'tir ve başarı olasılığı (kafa alma) 0,42'dir.

# Expected number of heads
expected_heads <- 5 * 0.42 expected_heads

Ağırlıklı madeni paranın 5 atışında beklenen tura sayısı 2,1'dir.

Bir olasılık histogramı oluşturmak için, R'de ggplot2 paketini kullanacağız. İlk olarak, paketi kurup yükleyelim.

install.packages ( "ggplot2" ) # Run this line if ggplot2 is not installed
library ( ggplot2 )

Ardından, dbinom() işlevini kullanarak 5 atıştaki tura sayısı için ayrık olasılık dağılımını oluşturacağız. Her olası tura sayısı (0'dan 5'e) için olasılıkları hesaplayacağız.

x <- 0 : 5 # Possible number of heads
p <- dbinom ( x , 5 , 0.42 ) # Probabilities

Şimdi ggplot2 kullanarak olasılık histogramını oluşturabiliriz.

# Create probability histogram
df <- data.frame ( x = x , p = p )
ggplot ( df , aes ( x = as.factor ( x ) , y = p ) ) + geom_bar ( stat = "identity" , fill = "lightblue" ) + xlab ( "Number of Heads" ) + ylab ( "Probability" ) + ggtitle ( "Probability Histogram for Number of Heads in 5 Tosses" )

Bu kod, x ekseninde kafa sayısını ve y ekseninde karşılık gelen olasılıkları içeren bir histogram oluşturacaktır.

Binomial Calculations in R
Binomial Calculations in R
  • 2020.09.12
  • www.youtube.com
In this vid, we learn how to do binomial calculation in R using the commands rbinom(), dbinom, pbinom(), and qbinom(). If this vid helps you, please help me ...
 

Düzgün Dağılım


Düzgün Dağılım

Herkese merhaba, bugün sürekli rasgele değişkenleri inceleyeceğiz ve özellikle düzgün dağılımlı olanları keşfedeceğiz.

Sürekli rastgele değişkenin ne olduğunu hatırlayarak başlayalım. Ayrık bir değerler kümesinin aksine, tüm bir aralık içindeki değerleri alabilen bir değişkendir. Örneğin, rastgele birini seçip tam boyunu ölçersek, bu rastgele değişkenin alabileceği sonsuz sayıda olası değer vardır. Sonuç olarak, belirli bir değer elde etme olasılığı son derece küçüktür, bu da belirli değerlerin olasılıklarını tartışmayı pratik yapmaz. Bunu ele almak için, belirli değer aralıklarına düşen rastgele değişkenle ilişkili olasılıklara odaklanıyoruz.

Örneğin, birinin tam olarak 58,6 inç boyunda olma olasılığını sormak yerine (ki bu neredeyse sıfırdır), boylarının 55 ila 65 inç arasında olma olasılığını sorgulayabiliriz. Bu yaklaşım, anlamlı olasılıklarla çalışmamızı sağlar. Başka bir örnek, rastgele seçilen bir şarkının tam olarak üç dakika yerine üç dakikadan az veya üç dakikadan uzun olma olasılığını düşünmektir.

Sürekli rasgele değişkenlerin en basit türlerinden biri düzgün dağılımdır. Düzgün dağılmış bir rasgele değişkende, olasılıklar tüm etki alanı boyunca eşit olarak dağılmıştır. Bu kavramla, belirtilen ondalık basamaklarla 0 ile 1 arasında rasgele bir sayı oluşturan Excel'in rand() işlevinde karşılaşmış olabilirsiniz. Bu durumda, tüm değerlerin olasılıkları eşittir. Bunu [0, 1] aralığında tekdüze bir dağılım olarak adlandırıyoruz.

Tekdüze bir dağılım için olasılıkları hesaplamak için, istenen aralığın genişliğini tüm aralığın toplam genişliğine böleriz. Örneğin, sonucun 0,2'den küçük olma olasılığı 0,2 bölü 1'dir (toplam genişlik), sonuç 0,2'dir. Benzer şekilde, ilgi aralığı 0,6 birim genişliğe sahip olduğundan, sonucun 4'ten büyük veya eşit olma olasılığı 0,6'dır. Bireysel sonuçların olasılıklarının son derece küçük olduğu göz önüne alındığında, sürekli rastgele değişkenlerle uğraşırken eşitsizliklerin katılığının (örneğin, "<" ve "<=") alakasız olduğunu belirtmekte fayda var.

Tekdüze olasılık dağılımları kavramını diğer aralıklara da genişletebiliriz. Örneğin, [1, 7] aralığının dikkate alınması, rastgele değişkenin eşit olasılıkla 1 ile 7 arasında herhangi bir değer alabildiği sürekli bir olasılık dağılımı verir. Bu dağılım içerisinden birkaç örneği inceleyelim:

  • Rastgele değişkenin 5'ten küçük olma olasılığı 4/6 veya 2/3'tür ve 1'den 5'e kadar olan aralığın genişliğinin (4) aralığın toplam genişliğine (6) bölünmesiyle hesaplanır.
  • Rastgele değişkenin 1,5'ten küçük veya eşit olma olasılığı 0,5/6 veya 1/12'dir. Burada, aralığın genişliğini 1'den 1,5'e (0,5) aralığın toplam genişliğine (6) böleriz.
  • Rastgele değişkenin 6,12'den büyük olma olasılığı 11/70 veya 0,157'dir ve 6,12'den 7'ye kadar olan aralığın genişliğinin, aralığın toplam genişliğine (70/5) bölünmesiyle elde edilir.

Sürekli rasgele değişkenler için olasılık histogramlarının çizilmesi, ayrık rasgele değişkenlerle aynı şekilde mümkün değildir, çünkü bireysel olasılıklar sonsuz derecede küçüktür. Bunun yerine, olasılığı yükseklik yerine alan olarak temsil eden yoğunluk grafikleri kullanırız. Düzgün bir dağılım için bir yoğunluk grafiğinde, tüm olasılıklar eşittir ve yatay bir çizgi ile sonuçlanır. Olasılıkların doğru bir şekilde toplanmasını sağlamak için yoğunluk grafiğinin altındaki toplam alan her zaman 1 olmalıdır.

Açıklamak için, [-5, 5] aralığında düzgün bir dağılım düşünelim. Bu durumda, alanın genişliği 10'dur (5 - (-5)). Yoğunluk eğrisini oluşturmak için, dikdörtgenin yüksekliğinin 1 bölü genişliğe ihtiyacı var, bu da bize 1/10 verir. Bu, yoğunluk eğrisi altındaki toplam alanın 1 olmasını sağlar.

Şimdi bu dağılımda rastgele değişkenin 3,5'tan büyük olma olasılığını hesaplayalım. Yoğunluk eğrisini yeniden çizebilir ve X > 3.5'e karşılık gelen bölgeyi gölgelendirebiliriz. Olasılık o zaman gölgeli bölgenin alanına eşittir.

Bir dikdörtgenin alanını hesaplamak için formülü uygulayarak (taban çarpı yükseklik), genişliği (5 - 3,5 = 1,5) yükseklikle (1/10) çarparız. Bu, 1,5/10 veya %15'lik bir alanla sonuçlanır.

Özetlemek gerekirse, U(-5, 5) düzgün dağılımında, X'in 3,5'ten büyük olma olasılığı %15'tir.

The Uniform Distribution
The Uniform Distribution
  • 2020.05.13
  • www.youtube.com
Your first continuous random variable! The uniform distribution is a fantastic way to learn the basics.
 

Sürekli Rastgele Değişkenler


Sürekli Rastgele Değişkenler

Herkese merhaba! Bugün, sürekli rasgele değişkenler konusunu inceleyeceğiz. Kesintisiz bir rasgele değişken, tüm aralıkta değerleri alabilen ve hassas ölçümlere izin veren bir değişkendir. Bu kavramı açıklamak için birkaç örnek inceleyelim.

Yerel hayvan barınağında rastgele bir köpek seçtiğinizi ve kuyruğunun uzunluğunu ölçtüğünüzü hayal edin. İstediğiniz doğruluk derecesinde ölçümler elde edebilirsiniz. Benzer şekilde, Güney Kutbu'nda rastgele bir anda kesin bir sıcaklık okuması yapmayı veya rastgele seçilmiş bir müşteri hizmetleri aramasının uzunluğunu ölçmeyi düşünün. Bu örnekler, değişkenleri herhangi bir kesinlik düzeyinde ölçme becerisini göstermektedir.

Buna karşılık, ayrı bir rasgele değişken, yalnızca sürekli olmayan bir kümeden değerler alabilir. Örneğin, bir zarı 20 kez atıp altılıları saymak 0, 1, 2, 3, 4 gibi tam sayıları verecektir. Ancak kesirler veya bir buçuk, üçte iki veya üç ve bir çeyrek gibi ondalık sayılar olası sonuçlar değildir.

Sürekli rasgele değişkenler için olasılıkları açıklamak, ayrık değişkenlerden daha karmaşıktır. Sonsuz sayıda olası sonuçla, belirli bir bireysel sonuç elde etme olasılığı esasen sıfırdır. Örneğin, bir müşteri hizmetleri aramasının 150 saniye sürdüğünü belirtirsek, gerçek uzunluk 150.1, 150.05 veya daha sayısız değer olabilir. Dolayısıyla, aramanın tam olarak 150 saniye sürme olasılığı temelde sıfırdır.

Bununla birlikte, belirli arama uzunlukları diğerlerinden daha olası görünebilir. 150 saniye süren bir aramanın, üç saat süren bir aramadan çok daha olası olmasını bekliyoruz. Sürekli rasgele değişkenlerin olasılıklarını ele almak için, belirli sonuçlardan ziyade değer aralıklarına odaklanırız. Örneğin, bir aramanın 140 ila 160 saniye arasında olma olasılığını göz önünde bulundururuz, bu da sıklıkla sıfır olmayan olasılıklar verir.

Sürekli bir rasgele değişkeni görselleştirmenin bir yolu, bir yoğunluk eğrisi kullanmaktır. Aralıklar üzerindeki olasılıklar daha sonra yoğunluk eğrisinin altındaki alanlar olarak temsil edilir. 0 ile 4 arasında değişen ve azalan olasılıkla X rastgele değişkenini gösteren bir grafiği inceleyelim. Grafikteki gölgeli bölge, belirli bir denemede X'in 1 ile 2 arasında düşme olasılığını temsil eder. Resimden, X'in 1 ile 2 arasına düşme olasılığının, 0 ile 1 arasına düşme olasılığından daha az olduğunu gözlemleyebiliriz. Bu tutarsızlık, 0'dan 1'e, 1'den 2'ye kıyasla eğri altında daha fazla alan olduğu için ortaya çıkar. Benzer şekilde, X'in 1 ile 2 arasına düşme olasılığı, 2 ile 3 arasına düşme olasılığından daha yüksektir. X'in 1 ile 2 arasına düşme olasılığını, yaklaşık olarak onda 3 veya %30

Bir yoğunluk eğrisi, genellikle bir olasılık yoğunluk fonksiyonu (PDF) olarak adlandırılır. Meşru bir PDF, iki temel özelliğe sahiptir. İlk olarak, olasılıkların olumlu doğasıyla uyumlu olmak için her zaman olumlu olmalıdır. İkinci olarak, geçerli bir PDF grafiğinin altındaki toplam alan her zaman bir olmalıdır, bu da bir olasılık deneyi yürütürken bir miktar X değeri elde ettiğimizi gösterir.

PDF kavramı ve yoğunluk eğrisi sezgisel olabilirken, bunları içeren gerçek hesaplamalar zorlayıcı olabilir. Uygulamada, kapsamlı hesaplamalara olan ihtiyacı atlamak için genellikle rasgele değişkenlerin kümülatif dağılım fonksiyonları (CDF'ler) ile çalışırız. Bir CDF, rastgele bir değişkenin belirli bir denemede belirtilen X değerinden büyük olmayan bir değer alma olasılığını sağlar. Esasen, olasılıkları biriktirir. Örneğin, X artarsa, daha fazla olasılık biriktikçe karşılık gelen CDF değeri de artar.

CDF'yi kullanarak, rastgele bir değişkenin belirli bir aralığa düşme olasılığını hesaplayabiliriz. Bu olasılık, aralığın alt ve üst sınırlarının CDF değerlerinin çıkarılmasıyla belirlenir. X ile gösterilen aynı rasgele değişkenin PDF ve CDF grafiğini inceleyelim. Grafikteki gölgeli bölge, X'in ikiden küçük veya ikiye eşit olması için birikmiş olasılığı temsil eder, F(2) olarak gösterilir, CDF ikide . Dikkat edin, X arttıkça CDF, F(X), daha fazla olasılık biriktiği için her zaman artar.

X'in a ve b gibi iki değer arasında düşme olasılığını hesaplamak için b'deki CDF değerini a'daki CDF değerinden çıkarırız. Grafikte bu, X eşittir 2'nin solundaki alanın X eşittir 1'in solundaki alandan çıkarılmasına karşılık gelir. Matematiksel olarak bu F(b) - F(a) şeklinde ifade edilir. Görsel anlatım bunu açıkça ortaya koyuyor.

En basit sürekli rasgele değişken türü, düzgün dağılımlı olandır. Düzgün bir dağılımda, eşit genişlikteki aralıklar için olasılıklar eşittir. Temel olarak, belirli bir aralıktaki her X değerinin eşit derecede olası olduğu anlamına gelir. Bunu görmenin başka bir yolu, düzgün dağılmış bir rasgele değişkenin PDF'sinin sabit bir fonksiyon olmasıdır.

Bir örnek düşünelim. Diyelim ki değerlerin 1 ile 7 arasında düzgün bir dağılımla düşebileceği sürekli bir rasgele değişkenimiz var. PDF, toplam alanı 1 olan, 1 ile 7 arasında sabit bir fonksiyondur. Aralığın genişliği 6 olduğundan, grafiğin yüksekliği 1/6'dır. Bu bilgiyle, herhangi bir X aralığı için olasılıkları hesaplayabiliriz. Örneğin, X'in 2 ile 7 arasına düşme olasılığı, aralığın genişliği olan 7 eksi 2'nin grafiğin yüksekliğine bölünmesiyle verilir. 1/6'dır. Böylece, olasılık (1/6) * (7 - 2) = 5/6'dır.

Tekdüze dağılımlarla ilgili daha kapsamlı bir açıklama istiyorsanız, yukarıda verilen bağlantıda bulabileceğiniz konuyla ilgili özel bir videom var.

Continuous Random Variables
Continuous Random Variables
  • 2020.09.26
  • www.youtube.com
Continuous random variables are cool. No, really! In this vid, we cover pdfs (probability density functions) and cdfs (cumulative distribution functions) and...