
Дана последовательность для алгоритма Лемпела- Зива: 10010110 Даны числа: 0,084 ; 0,168 ; 0,336 ;
0,0336 ; 0,3784.Задание номер 1: Вероятности символов даны в таблице. Используя алгоритм Хаффмена найти коды символов и рассчитать эффективность кодирования.Желательно с решением, т.к. тему не понял

Ответы на вопрос

Для определенности назову сами символы как-нибудь:
A (0.084), B (0.168), C (0.336), D (0.0336), E (0.3784)
Алгоритм Хаффмана:
- упорядочиваем символы по возрастанию
- сливаем вместе два символа с наименьшими вероятностями, получаем составной символ с вероятностью, равной сумме вероятностей
- повторяем, пока не останется один символ
По сути это строит дерево Хаффмана, но мне рисовать весь процесс не хочется, буду писать в строчку:
D (0.0336), A (0.084), B (0.168), C (0.336), E (0.3784) - сливаем D и A, получается (D, A) с вероятностью 0.0336 + 0.084 = 0.1176
(D, A) (0.1176), B (0.168), C (0.336), E (0.3784) - сливаем (D, A) и B, получается ((D, A), B) с вероятностью 0.1176 + 0.168 = 0.2856
((D, A), B) (0.2856), C (0.336), E (0.3784) - сливаем ((D, A), B) и C, получается (((D, A), B), C) с вероятностью 0.2856 + 0.336 = 0.6216
E (0.3784), (((D, A), B), C) (0.6216) - сливаем в (E, (((D, A), B), C)), для проверки: вероятность 0.3784 + 0.6216 = 1
(E, (((D, A), B), C)) (1)
Готово! Если хочется перерисовать в виде бинарного дерева, у родителя (x, y) потомки x и у, мой вариант (для компактности он изображен немного искаженно) во вложении.
Осталось получить коды символов. Корню присваиваем пустой код, для левого потомка приписываем к коду родителя 0, для правого 1.
Получаем коды: A = 1001, B = 101, C = 11, D = 1000, E = 0.
Эффективность кодирования - это ожидаемая длина кода. Она в данном случае равна
0,084 * 4 + 0,168 * 3 + 0,336 * 2 + 0,0336 * 4 + 0,3784 * 1 = 2,0248 бит
Для сравнения, по формуле Шеннона количество информации в битах на один символ




Для построения кодов Хаффмана и расчета эффективности кодирования нам необходимо знать вероятности символов в данной последовательности. Вы предоставили последовательность "10010110", но не предоставили вероятности для каждого символа. Вероятности символов определяются на основе частоты их появления в данной последовательности.
Предположим, что в данной последовательности есть два уникальных символа: "0" и "1". Давайте предположим, что вероятность появления символа "0" равна 5/8, а вероятность появления символа "1" равна 3/8. Теперь мы можем построить коды Хаффмана и рассчитать эффективность кодирования.
Шаг 1: Построение дерева Хаффмана. Для символа "0":
- Вероятность: 5/8
- Код: 0
Для символа "1":
- Вероятность: 3/8
- Код: 1
Дерево Хаффмана:
scss (5/8)
0/1
/ \
(3/8) (2/8)
1/0 0/1
Шаг 2: Расчет эффективности кодирования. Эффективность кодирования может быть оценена с помощью средней длины кодового слова, которая вычисляется по формуле:
Эффективность = Σ(Вероятность символа * Длина кода символа)
Для символа "0":
- Вероятность: 5/8
- Длина кода: 1 (один бит)
- 5/8 * 1 = 5/8
Для символа "1":
- Вероятность: 3/8
- Длина кода: 1 (один бит)
- 3/8 * 1 = 3/8
Средняя длина кодового слова: Эффективность = (5/8) * 1 + (3/8) * 1 = 5/8 + 3/8 = 8/8 = 1
Таким образом, эффективность кодирования с использованием кодов Хаффмана для данной последовательности (при предполагаемых вероятностях) составляет 1 бит на символ.


Похожие вопросы








Топ вопросов за вчера в категории Информатика







Последние заданные вопросы в категории Информатика
-
Математика
-
Литература
-
Алгебра
-
Русский язык
-
Геометрия
-
Английский язык
-
Химия
-
Физика
-
Биология
-
Другие предметы
-
История
-
Обществознание
-
Окружающий мир
-
География
-
Українська мова
-
Информатика
-
Українська література
-
Қазақ тiлi
-
Экономика
-
Музыка
-
Право
-
Беларуская мова
-
Французский язык
-
Немецкий язык
-
МХК
-
ОБЖ
-
Психология
-
Физкультура и спорт
-
Астрономия
-
Кыргыз тили
-
Оʻzbek tili