Общепринятые обозначения в теории вероятностей:
& - союз "и", пересечение событий, множеств
A&B - обозначает такой вариант, при котором одновременно и A и B.
P(E) - вероятность варианта E, или можно, события E (так принято называть, хотя в данном случае кривовато выглядит).
P(X&Y) - вероятность, что одновременно и X и Y. Например:
P(Q) - вероятность выпадения орла, P(W) - вероятность выпадения решки. P(W&Q) - вероятность, что одновременно упадут и орёл и решка (равна нулю).
Насчёт событий. У нас есть некоторое общее пространство событий, можно обозвать его как угодно, например U. В нём перечислены все варианты возможных событий, все виды Вселенных, так сказать. Можно его задать:
{N, -N}
Это полное задание. То есть, других вариантов быть просто не может. Вселенная либо естественна, либо нет. Все варианты событий входят в них. И вариант L (Вселенная имеет жизнь) у нас тоже там есть, распределён по этим двум.
Можно задать то же пространство по другому (взглянуть с другой стороны):
{F, -F}
Что это означает, думаю, объяснять не надо.
Разумеется, каждое событие (и F, и -F) имеет свою вероятность. Полная вероятность всех событий равна нулю.
Можно задать более подробно то же пространство:
{F&N, F&-N, -F&N, -F&-N}
Мы перечислили следующие варианты, Вселенная:
- дружественна и естественна;
- дружественна и неестественна;
- недружественна и естественна;
- недружественна и неестественна.
Всего 4-е варианта. Ну и можно задать и так:
{F&N&L, F&N&-L, F-N&L, F&-N&-L, -F&N&L, -F&N&-L, -F&-N&L, -F&-N&-L}
все 8 вариантов, полнота налицо. Полная сумма = 1.
Вспомним наши допущения. Что там? Принцип антропности. Вселенная не может быть естественной, с жизнью и недружелюбной. То есть, вероятность такого события равна нулю.
P(-F&N&L) = 0
Кстати, напомню про аксиому:
X&Y = Y&X, событие "X и Y" эквивалентно событию "Y и X".
соответственно, P(X&Y) = P(Y&X)
а значит: P(-F&N&L) = P(-F&L&N) = P(N&-F&L) = P(N&L&-F) = P(L&-F&N) = P(L&N&-F)
Упомянём про подпространства (важно для понимания условных вероятностей).
Наше пространство можно разделить на части. Например, возьмём и выделим из нашего пространства все события, в которых Вселенная естественна. То есть, подпространство:
{N}
Что у нас сюда входит? Вот такие варианты:
{N&F&L, N&F&-L, N&-F&L, N&-F&-L} - наше подпространство {N}, расписано поподробнее. Вариант N&-F&L равен нулю. А вариант -N&-F&L сюда вообще не входит.
Так как наше подпространство ровно разбивается всеми этими событиями на части (то есть, нет события в нашем подпространстве, которое бы не входило в один из этих вариантов, они полностью заполняют это пространство, а сами эти события друг с другом не пересекаются - это всё называется разбиением), то сумма этих вероятностей равна вероятности всего подпространства {N} (то есть P(N)):
P(N) = P(N&F&L) + P(N&F&-L) + P(N&-F&L) + P(N&-F&-L)
Вообще, полезно запомнить что-то вроде P(X) = P(X&Y) + P(X&-Y), универсальная формула. Каждый из них ещё можно разбить на Z и -Z, например.
Ещё можно такую наглядную аналогию:
два множества (два таких круга, как на картинках со множествами), N и F, пересекаются. Их пересечение это множество N&F. Можно сказать N-ная часть от множества F. Соответственно, та часть F, которая не пересекается со множеством N (F&-N) - это -N-ная часть от F. Сумма обеих этих частей равна F.
P(F) = P(N&F) + P(-N&F)
вероятность в таком случае, это "вес" множества. Полное пространство имеет вес = 1.
Можно ещё вспомнить объединение множеств:
NVF (V = значёк "или", "объединение). В него входят и N&-F и N&F и -N&F. Соответственно, вероятность P(NVF), это вероятность, что F, но не N, или N, но не F или и N и F одновременно. P(NVF) = P(N&-F) + P(N&F) + P(-N&F).
Вспоминая формулу P(X) = P(X&Y) + P(X&-Y)
P(NVF) = P(N) + P(-N&F)
P(NVF) = P(F) + P(-F&N)
а ещё можно так:
P(NVF) = P(N&-F) + P(N&F) + P(-N&F) =
P(N&-F) + P(N&F) + P(-N&F) + P(N&F) - P(N&F) (добавили и прибавили P(N&F))
объединяем первое со вторым и третье с четвёртым
P(NVF) = P(N) + P(F) - P(N&F)
то есть, вероятность объединения событий N и F (получается N или F или оба одновременно) равна сумме вероятностей этих событий самих по себе минус вероятность их пересечения (и N и F одновременно). Опять получили универсальную формулу на любой случай:
P(XVY) = P(X) + P(Y) - P(X&Y)
Несовместимые события - это события, вероятность одновременного происхождения которых равна нулю. P(X&Y) = 0 Отсюда:
P(XVY) = P(X) + P(Y)
вероятность события "или X или Y" равна сумме вероятностей события X и события Y.
Пример:
E - выпала 1-ца на шестигранном кубике
R - выпала 3-ка
события несовместимые, их пересечение равно нулю
P(EVR) = P(E) + P(R) = 1/6 + 1/6 = 1/3
Вероятность, что выпадет или 1 или 3 равна 1/3
Ещё пример. N и -N - несовместимые события.
P(NV-N) = P(N) + P(-N) = 1
Кстати, вполне очевидно что P(A) = 1 - P(-A) (если мы рассматриваем в полном пространстве, конечно).
И ещё вот такой вывод из нашей универсальной формулы:
P(XVY) = P(X) + P(Y) - P(X&Y)
P(X&Y) = P(XVY) - P(X) - P(Y) = P(XVY) - (P(X) + P(Y))
объяснять смысл не надо?
А вообще, объединение событий мы тут практически не используем (в нашем споре), это для общей картины.
Теперь об условных вероятностях. Всё просто:
P(X|Y) - вероятность X при условии Y. То есть, мы уже знаем что точно Y произошло, какова теперь вероятность X?
Поясним на примере.
Мы знаем, что выпало 1, какова вероятность что выпало 3?
P(3|1) = 0
Чуть сложнее. Мы знаем, что выпало чётное число (X), какова вероятность, что выпало 2? А 3?
P(2|X) = ? Всего три равновероятных варианта: 2, 4 и 6 (событие X - выпало чётное число). Вероятность, что это 2 = 1/3
P(2|X) = 1/3
Очевидно что P(3|X) = 0.
Можно на примере подпространств.
Наше пространство
{1, 2, 3, 4, 5, 6}
можно разделить на два подпространства
{1, 3, 5} - нечётное число и {2, 4, 6} - чётное число.
Вероятность X (чёт) = 1/2. Вероятность Y (нечёт) = 1/2
Какова вероятность P(4|X) (выпала четвёрка, при условии, что выпало чётное число)? Нетрудно догадаться, что она равна вероятности события "и 4 и чётное" поделить на вероятность "чётное". Ну, примерно так

P(4|X) = P(4&X)/P(X) = 1/6 / 1/2 = 1/3
А вероятность P(5|X)? Вероятность P(5&X) равна нулю, так что:
P(5|X) = P(5&X)/P(X) = 0
поясню на примере наглядной картинки с множествами (напрягаем воображение, рисовать мне лень)
Часть нашего универсального пространства U занимает множество X. Что означает, что условие X уже произошло? Оно означает, что мы отбрасываем всё, что вне X, и принимаем вес X за единицу. Все подмножества внутри X при этом тоже увеличат свой вес пропорционально, так что их общий вес станет 1. Общий вес у них до этого был какой? P(X). А после их общий вес стал 1. Значит, просто их веса умножились на 1/P(X).
Любое событие внутри X (например P(E)) стало весить больше в 1/P(X) раз. И бывшая P(E) стала P(E)/P(X). То есть P(E|X) = P(E)/P(X). Но это не совсем точная формула.
Представим событие (множество) A, которое частично пересекается со множеством X. После того как всё что вне X (то есть -X) отбросилось, от A у нас остался только кусок A&X (пересечение A и X). Вместо старого пространства U у нас теперь новое универсальное пространство X! И часть множества A, которая A&X, тоже увеличило свой вес внутри X. P(A|X) = P(A&X)/P(X). Вот это - точная универсальная формула.
Кстати, если вес A в пространстве X равен P(A|X), то вес A в универсальном пространстве U тоже можно обозначить как P(A|U) = P(A).
А теперь вернёмся к нашим кубикам

Возьмём X - выпало больше 2 очков. И Y - выпало меньше 5 очков.
Какова вероятность P(X|Y) (вероятность, что выпало больше двух очков, если мы знаем, что выпало меньше пяти очков)?
P(X) (выпало больше 2) состоит из 3, 4, 5, 6. Имеет вероятность 4/6.
P(Y) (выпало меньше 5) состоит из 1, 2, 3, 4. Тоже 4/6.
P(X&Y) (выпало одновременно меньше 5 и больше 2), X&Y состоит из 3 и 4. Вес = 2/6
Значит P(X|Y) = P(X&Y)/P(Y) = 2/6 : 4/6 = 1/2
И действительно, если мы знаем что выпало Y (1, 2, 3 или 4), то вероятность, что выпало больше 2 (3 или 4) равна 2 из 4.
Из формулы P(X|Y) = P(X&Y)/P(Y) легко вывести универсальную формулу для вероятности пересечения двух событий:
P(X&Y) = P(Y)*(PX|Y)
вероятность, что произошло одновременно и X и Y равна вероятности, что произошло Y, умножить на вероятность,
что произошло X при условии Y.
Также можно заметить, что раз
P(Y|X) = P(Y&X)/P(X)
а P(X&Y) = P(Y&X), то
P(X&Y) = P(Y)*P(X|Y) = P(X)*P(Y|X)
И про зависимые, независимые события.
P(X|Y), вероятность, что X, при условии, что уже произошло Y. Что означает, что X не зависит от Y? Это означает, что вероятность X при условии Y равно просто вероятности X (ведь ему плевать на условие Y). Для независимых событий:
P(X|Y) = P(X)
а значит P(X&Y) = P(X)*P(Y)
Вот так. Если вероятность X не зависит от вероятности Y, то легко вывести самому, что и вероятность Y не зависит от вероятности X (если они не равны нулям). В самом деле, раз
P(X&Y) = P(Y)*P(X|Y) = P(X)*P(Y|X)
выводим P(Y)*P(X|Y) = P(Y)*P(X) = P(X)*P(Y|X) из последнего, деля на P(X) (при условии, что оно не равно нулю) P(Y) = P(Y|X).
Ну а если P(X) равно нулю, а P(Y) нет, то, естественно, P(Y|X) не известно. Какова вероятность Y при условии, что произошло X? Но ведь X не может произойти!
Пример независимых событий.
Бросание двух монеток (или одной дважды). A - орёл на первой монетке. B - орёл на второй монетке. Они, вполне очевидно, независимы. Значит, вероятность, что выпало сразу два орла:
P(X&Y) = P(X)*P(Y) = 1/2 * 1/2 = 1/4
Вспомним-ка про наш антропный принцип.
P(F|N&L) = 1
Вероятность, что вселенная дружественна, при условии, что Вселенная естественна и населена, равна 1. То есть, в нашем подпространстве N&L событие F занимает всё подпространство целиком. P(F&N&L) = P(N&L)
А противоположное событие в этом подпространстве P(-F|N&L) = 0.
Теперь, вооружившись знаниями, я, надеюсь, ты сумеешь сам понять смысл всех символосочетаний и легко справишься с этими преобразованиями?
P(N|F&L) =
P(N&F&L)/P(F&L) =
P(F&N&L)/P(F&L) =
P(F|N&L)*P(N&L)/(P(F|L)P(L)) =
P(F|N&L)*P(N|L)*P(L)/(P(F|L)P(L)) =
P(F|N&L)*P(N|L)/P(F|L) =
P(N|L)/P(F|L)
Не спеши, попробуй перечитать теорию несколько раз, покрутить в голове различные примеры.
А что до теоремы Байеса... о ней как-нибудь в другой раз.