Навигация
- Главная
- Адресация в системе электронной почты
- Протоколы приёма и передачи почты
- Организация службы электронной почты в сети Интернет
- Почтовые программы
- Особенности национальной переписки
- Работа с почтой через браузер
- Списки рассылки, веб-форумы и группы новостей
- Спам и почтовый этикет
- Шифрование почты и цифровая подпись
Реклама:
Протоколы приёма и передачи почты
Почтовые программы для персональных компьютеров используют разные протоколы для приема и отправки почты. При отправке почты программа взаимодействует с сервером исходящей почты, или SMTP-сервером, по протоколу SMTP. При приеме почты программа взаимодействует с севером входящей почты, или POP3-сервером по протоколу POP3. Это могут быть как разные компьютеры, так и один и тот же компьютер. Вам необходимо получить имена этих серверов у своего провайдера. Иногда для приема почты используется более современный протокол - IMAP, который позволяет, в частности, выборочно копировать пришедшие для вас письма с почтового сервера на ваш компьютер. Чтобы использовать этот протокол, необходимо, чтобы он поддерживался как вашим провайдером, так и вашей почтовой программой. Теперь рассмотрим эти протоколы более подробно.
Простой протокол передачи почты (SMTP)
Взаимодействие в рамках SMTP строится по принципу двусторонней связи, которая устанавливается между отправителем и получателем почтового сообщения. При этом отправитель инициирует соединение и посылает запросы на обслуживание, а получатель - отвечает на эти запросы. Фактически отправитель выступает в роли клиента, а получатель - сервера.

Рис.1 Схема взаимодействия по протоколу SMTP
Канал связи устанавливается непосредственно между отправителем и получателем сообщения. При таком взаимодействии почта достигает абонента в течение нескольких секунд после отправки
Команды SMTP и их последовательность
Простой протокол передачи почты обеспечивает двухсторонний обмен сообщениями между локальным клиентом и удаленным сервером МТА. МТА-клиент шлет команды МТА-серверу, а он, в свою очередь, отвечает клиенту. Другими словами, протокол SMTP требует получать ответы от приемника команд SMTP. Обмен командами и ответами на них называется почтовой транзакцией (mail transaction). Данные передаются в формате NVT ASCII. Кроме того, команды тоже передаются в формате NVT ASCII. Команды передаются в форме ключевых слов, а не специальных символов, и указывают на необходимость совершить ту или иную операцию. В табл. 1 приведен список ключевых слов (команд), определенный в спецификации SMTP.
Команды простого протокола передачи почты (SMTP)
| Команда | Обязательна | Описание |
| HELO | Х | Идентифицирует модуль-передатчик для модуля-приемника (hello). |
| Х | Начинает почтовую транзакцию, которая завершается передачей данных в один или несколько почтовых ящиков (mail). | |
| RCPT | Х | Идентифицирует получателя почтового сообщения (recipient). |
| DATA | Строки, следующие за этой командой, рассматриваются получателем как данные почтового сообщения. В случае SMTP, почтовое сообщение заканчивается комбинацией символов: CRLF-точка-CRLF. | |
| RSET | Прерывает текущую почтовую транзакцию (reset). | |
| NOOP | Требует от получателя не предпринимать никаких действий, а только выдать ответ ОК. Используется главным образом для тестирования. (No operation.) | |
| QUIT | Требует выдать ответ ОК и закрыть текущее соединение. | |
| VRFY | Требует от приемника подтвердить, что ее аргумент является действительным именем пользователя. | |
| SEND | Начинает почтовую транзакцию, доставляющую данные на один или несколько терминалов (а не в почтовый ящик). | |
| SOML | Начинает транзакцию MAIL или SEND, доставляющую данные на один или несколько терминалов или в почтовые ящики. | |
| SAML | Начинает транзакцию MAIL и SEND, доставляющие данные на один или несколько терминалов и в почтовые ящики. | |
| EXPN | Команда SMTP-прнемнику подтвердить, действительно ли аргумент является адресом почтовой рассылки и если да, вернуть адрес получателя сообщения (expand). | |
| HELP | Команда SMTP-приемнику вернуть сообщение-справку о его командах. | |
| TURN | Команда SMTP-приемнику либо сказать OK и поменяться ролями, то есть стать STMP-передатчиком, либо послать сообщение-отказ и остаться в роли SMTP-приемника. |
Команды, помеченные крестиком, обязаны присутствовать в любой реализации SMTP. Остальные команды могут быть реализованы дополнительно. Каждая SMTP-команда должна заканчиваться либо пробелом (если у нее есть аргумент), либо комбинацией CRLF. SMTP способен передавать данные любого содержания (например, текст, графические, звуковые файлы).
MTP обеспечивает двухстороннюю связь между агентами передачи почты (МТА), клиентом и сервером. Клиенты шлют команды серверу, а серверы отвечают клиентам. Однако SMTP оговаривает последовательность SMTP-команд. Лучший способ понять это — взглянуть на образец почтовой транзакции. Следующий пример демонстрирует типичную почтовую транзакцию. В примере фигурирует мистер Smith (на компьютере usc.edu), посылающий сообщения мистерам Jones, Green и Brown (на компьютере mit.edu). Агент передачи почты хоста mit.edu принимает почту для мистеров Jones и Brown, однако не знает, где расположен почтовый ящик мистера Green.
Для целей дальнейшего повествования каждой строке присвоен номер и обозначено, кому они принадлежат - передатчику или приемнику. Текст справа от слов “RECEIVER” или “SENDER” содержит действительно передаваемые данные. Трехзначные цифровые комбинации в начале передаваемых строк обозначают коды ответа. Ответ SMTP похож на сообщения-подтверждения о доставке, поскольку появляется лишь в том случае, когда приемник получил данные.
1. RECEIVER: 220 mit.edu Simple Mail Transfer Service Ready
2. SENDER: HELO usc.edu
3. RECEIVER: 250 mit.edu
4. SENDER: MAIL FROM:<Smith@usc.edu>
5. RECEIVER: 250 OK
6. SENDER: RCPT TO:<Jones@init.edu>
7. RECEIVER: 250 OK
8. SENDER: RCPT TO:<Green@mit.edu>
9. RECEIVER: 550 No such user here
10. SENDER:: RCPT TO <Brown@mit.edu>
11. RECEIVER: 250OK
12. SENDER: DATA
13. RECEIVER: 354 Start mail input; end with <CRLF>.<CRLF>
14. SENDER: Blah blah blah...
15. SENDER: ...etc. etc. etc.
16. SENDER: .
17. RECEIVER: 250 OK
18. SENDER: QUIT
19. RECEIVER: 221 mit.edu Service closing transmission channel
Как видно из строки 1, когда SMTP-клиент устанавливает TCP-соединение с портом протокола 25, SMTP-сервер отвечает кодом 220. Это означает, что соединение успешно установлено:
1. RECEIVER: 220 mit.edu Simple Mail Transfer Service Ready
После того, как MTA компьютеров mit.edu и usc.edu установили соединение и обменялись приветствием, первой командой должна быть команда HELO. Как указано в строке 2, SMTP-клиент передает HELO, называя имя своего компьютера в качестве аргумента. Команда HELO употребляется с аргументом, как показано ниже:
2. SENDER: HELO usc.edu
В ответ на HELO приемник выдает код 250, сообщая передатчику о том, что команда принята и обработана:
3. RECEIVER: 250 mit.edu
После установления TCP-соединения и идентификации (при помощи HELO) SMTP-клиент приступает к почтовой транзакции. Для начала он выполняет одну из следующих команд: MAIL, SEND, SOML или SAML. В нашем примере использована команда MAIL:
4. SENDER: MAIL FROM:<Smith@usc.edu>
Четыре команды, MAIL, SEND, SOML и SAML, имеют одинаковый синтаксис
MAIL <пробел> FROM:<reverse-path> <carriage-return> line-feed>
Аргумент “обратный путь” (reverse path) указывает серверу, кому в случае ошибки отослать соответствующее сообщение. В аргументе содержится адрес источника сообщения (в нашем случае, Smith@usc.edu). После того как сервер выдал код ответа 250 (строка 5), согласившись обработать сообщение от Smith@usc.edu, необходимо указать получателя сообщения. Это делается при помощи команды RCPT. Команда RCPT имеет аргумент - имя получателя. На одну команду приходится только одно имя, поэтому, если получателей несколько, команда RCPT выдается несколько раз. В нашем примере команды RCPT выполняются в строках 6,8 и 10. Синтаксис RCPT похож на синтаксис команды MAIL:
RCPT <про6ел> TO:<forward-path> <CRLF>
Однако, в отличие от MAIL, аргумент RCPT начинается со слова “TO:”. Содержимое аргумента - путь передачи сообщения (forward path), а не обратный путь. В пути передачи сообщения указано имя почтового ящика получателя. Выдав команду RCPT, МТА-клиент ожидает получить ответ с кодом 250. Однако, в ответ на восьмую строку
8. SENDER: RCPT TO:<Green@mit.edu>
сервер отвечает кодом 550:
9. RECEIVER: 550 No such user here
Код ответа 550 означает, что МТА не в состоянии выполнить запрос клиента, поскольку не знает, как доставить почту указанному пользователю. То есть скорее всего у мистера по фамилии Green нет почтового ящика (Green@mit.edu) на этом компьютере. В протоколе SMTP сказано, что сервер обязан информировать клиента об отсутствии почтового ящика получателя сообщения.
После того как посланы все команды RCPT, клиент начинает передачу при помощи команды DATA. В строке 12 показано, как МТА-клиент (передатчик) высылает команду DATA, в строке 13 - как сервер отвечает кодом 354. Этот код означает, что передача данных разрешена и должна заканчиваться комбинацией CRLF-точка-CRLF (новой строкой, содержащей только точку).
12. SENDER: DATA
13. RECEIVER: 354 Start mail input; end with <CRLF>.<CRLF>
После того как получен код 354, клиент может начать передачу данных. МТА-сервер, в свою очередь, помещает принятые данные в очереди входящих сообщений. Сервер не высылает никаких ответов до тех пор, пока не получит комбинацию CRLF-точка-CRLF от клиента, означающую конец передачи данных. Как показано в строках 16 и 17, в ответ на полученную комбинацию CRLF-точка-CRLF, сервер выдает код 250, что означает успешное окончание операции:
16. SENDER: .
17. RECEIVER: 250 OK
Для того, чтобы закончить почтовую транзакцию, клиент, по правилам SMTP, обязан послать команду QUIT. Сервер, в свою очередь, отвечает кодом 221, который подтверждает клиенту, что соединение будет закрыто, после чего соединение действительно закрывается:
18. SENDER: QUIT
19. RECEIVER: 221 mit.edu Service closing transmission channel
В любой момент во время транзакции клиент может использовать команды NOОР, HELP, EXPN и VRFY. В ответ на каждую команду сервер высылает клиенту определенную информацию. В зависимости от ответа клиент может предпринять определенные действия.
Коды ответов SMTP
В спецификации SMTP требуется, чтобы сервер отвечал на каждую команду SMТР-клиента. МТА-сервер отвечает трехзначной комбинацией цифр, называемой кодом ответа. Вместе с кодом ответа, как правило, передается одна или несколько строк текстовой информации.
Каждая цифра в коде ответа имеет определенный смысл. Первая цифра означает, было ли выполнение команды успешно (2), неуспешно (5) или еще не закончилось (3). Простой клиент может анализировать только первую цифру в ответе сервера, и на основании ее продолжать свои действия. Вторая и третья цифры кода ответа разъясняют значение первой.
| Код | Значение |
| 211 | Ответ о состоянии системы или помощь |
| 214 | Сообщение-подсказка (помощь) |
| 220 | <имя_домена> служба готова к работе |
| 221 | <имя_домена> служба закрывает канал связи |
| 250 | Запрошенное действие почтовой транзакции успешно завершилось |
| 251 | Данный адресат не является местным; сообщение будет передано по маршруту <forward-path> |
| 354 | Начинай передачу сообщения. Сообщение заканчивается комбинацией CRLF-точка-CRLF |
| 3421 | <имя_домена> служба недоступна; соединение закрывается |
| 3450 | Запрошенная команда почтовой транзакции не выполнена, так как почтовый ящик недоступен |
| 3451 | Запрошенная команда не выполнена; произошла локальная ошибка при обработке сообщения |
| 3452 | Запрошенная команда не выполнена; системе не хватило ресурсов |
| 3500 | Синтаксическая ошибка в тексте команды; команда не опознана |
| 3501 | Синтаксическая ошибка в аргументах или параметрах команды |
| 3502 | Данная команда не реализована |
| 3503 | Неверная последовательность команд |
| 3504 | У данной команды не может быть аргументов |
| 3550 | Запрошенная команда не выполнена, так как почтовый ящик и недоступен |
| 3551 | Данный адресат не является местным; попробуйте передать сообщение по маршруту <forward-path> |
| 3552 | Запрошенная команда почтовой транзакции прервана; дисковое пространство, доступное системе, переполнилось |
| 3553 | Запрошенная команда не выполнена; указано недопустимое имя почтового ящика |
| 3554 | Транзакция не выполнена |
Цифра 1 означает, что сервер МТА принял команду, от клиента требуется дополнительное подтверждение. Клиент обязан послать дополнительную информацию о том, продолжать или прервать выполнение запрошенной команды. Из табл. 2 видно, что SMTP не имеет в составе таких команд, то есть коды ответа, начинающиеся с единицы, отсутствуют. В настоящее время команд SMTP, которые бы потребовали дополнительного подтверждения, нет. Разработчики ориентировались на то, что такие команды появятся, и зарезервировали для них коды, начинающиеся с цифры 1.
Коды ответа, начинающиеся с цифры 2, означают, что сервер МТА успешно завершил выполнение команды и ожидает появления новой. Код ответа, начинающийся на 3, означает, что команда начала выполняться, но серверу необходима дополнительная информация для ее завершения. Пример такого кода - 354. В ответ на него клиент МТА должен приступить к передаче почтового сообщения. Код, начинающийся с цифры 4, означает, что сервер не принял команду, и она не выполнена. Во всех ответах серии 400 предполагается, что ошибка временная и клиент может попытаться ее исправить. Коды ответа серии 500 также сообщают, что команда не выполнена. Кроме того, клиент не должен пытаться повторить ту же команду еще раз (по крайней мере в составе той же последовательности).
Вторая цифра кода ответа обозначает категорию ошибки. Цифра 0 обозначает синтаксическую ошибку. Команда может быть слишком длинной, иметь неправильный аргумент или отсутствовать в списке команд сервера.
У сообщений с кодами 211 и 214 из табл. 2 вторая цифра кода равна единице и оба они информационного характера. У команд с кодами 220, 221 и 421 вторая цифра — двойка, и все они имеют дело с передачей данных или с коммуникационным каналом. Коды ответов, у которых вторая цифра равна пяти (250, 450 и 550) связаны непосредственно с почтовой системой. В настоящее время в SMTP не определены значения кодов, вторая цифра которых равна трем или четырем.
Каждая отдельная строка сообщения должна иметь собственную третью цифру в коде ответа. Рассмотрим, например, сообщения с кодами от 500 до 504. Каждое сообщение означает отдельную синтаксическую ошибку. Поскольку строки, описывающие различные виды ошибок, разные, то и коды ответа должны отличаться друг от друга. Каждое сообщение об ошибке имеет свой собственный порядковый номер в данной серии. Спецификация SMTP рекомендует, но не обязывает использовать строго заданные текстовые строки в ответах MTA-сервера.
Ответ MTA-сервера может состоять из нескольких строк специального формата. Каждая строка (кроме последней) многострочного ответа начинается с кода ответа, дефиса (-), текста и комбинации CRLF. Последняя строка многострочного ответа начинается с кода ответа, за которым следует пробел:
123-Первая строка сообщения из нескольких строк
123-Код ответа, 123, не изменяется
123-1 сообщение может начинаться с цифры
123 Последняя строка начинается не с дефиса, а с пробела
За кодом каждой строки, кроме последней, следует знак дефиса (-). Это необходимо, чтобы клиент MTA смог отличить строку-продолжение ответа от последней строки. За кодом ответа в последней строке всегда следует пробел.
Ограничения по размерам
В стандарте SMTP сказано, что реализации SMTP не должны ограничивать максимальную длину обрабатываемых объектов (возможно, для будущих ра ширений стандарта). Однако, в настоящий момент SMTP ограничивает допустимые размеры следующими величинами, приведенными в табл. 3.
Ограничения на размеры объектов SMTP
| Объект SMTP | Ограничение |
| User | Максимальная длина имени пользователя: 64 символа |
| Domain | Максимальная длина имени домена: 64 символа |
| Path | Максимальная длина обратного маршрута или маршрута доставки, включая знаки пунктуации и символы-oграничители: 256 знаков |
| Command line | Максимальная длина командной строки, включая ключевое слово и символы CRLF: 512 знаков |
| Reply line | Максимальная длина строки ответа, включая код ответа и символы CRLF: 512 знаков |
| Text line | Максимальная длина текстовой строки, включая символы CRLF: 1000 знаков |
| Recipients | Максимальное количество получателей сообщения (за одну транзакцию): 100 |
Если клиент МТА превысил ограничения на размер передаваемой информации, сервер МТА отвечает одним из следующих кодов:
500 Line too long.
(слишком длинная строка)
501 Path too long.
(слишком длинный путь)
552 Too many recipients.
(слишком много получателей)
552 Too much mail data.
(слишком много данных в сообщении)
Промежуточные агенты
Термин “маршрут доставки” (forward-path) служит для того, чтобы отличать почтовый ящик (mailbox), имя которого абсолютно, от пути (он может быть различным), по которому следует почта. Предположим, что нужно доставить два почтовых сообщения на один и тот же сетевой компьютер. Оба сообщения имеют один и тот же адрес, однако, не обязательно будут следовать по одному и тому же маршруту. Точно так же, если на пришедшие сообщения выдаются ответы, они не обязательно будут следовать по указанному обратному маршруту (reverse-path). Как правило, конкретный маршрут для почты выбирается системным администратором. Чтобы направить почту по нужному пути, используются значения маршрута доставки и обратного маршрута, в которых указываются промежуточные агенты (relay agents). Промежуточный агент доставки - это МТА, так называемый почтовый хаб (mail hub), настроенный на передачу транзитной почты. Чтобы доставить сообщение, местный агент пользователя (UA) передает его местному МТА, который, в свою очередь, передает его промежуточному агенту МТА. В следующем примере Smith@usc.edu является почтовым ящиком, a HOST1, HOST2 и HOST3 - промежуточными агентами:
MAIL FROM:<@HOSTI, @HOST2, @HOST3:Smith@usc.edu>
Промежуточные агенты присутствуют практически во всех сетях, входящих в Internet.

Рис. 2 Почтовая система Интернет с участием промежуточных агентов.
Чтобы упростить процесс конфигурации почтовой системы, в локальной сети устанавливается один компьютер, служащий промежуточным агентом (relay host). Вся почта пользователей попадает сначала на него. Затем этот компьютер рассылает сообщения по Internet. Кроме всего прочего, такой компьютер может служить защитой фирмы от взломщиков-хакеров из Internet. Ограничивая общение локальной сети с внешним миром до уровня почты, организация сводит до минимума риск нежелательного вторжения в свои собственные системы. Кроме того, администрировать и защищать в этом случае приходится единственный компьютер. SMTP в состоянии послать сообщение непосредственно с компьютера пользователя на компьютер адресата в том случае, если между ними существует прямое почтовое соединение. Но обычно между двумя компьютерами находятся промежуточные агенты. Чтобы обеспечить доставку, в почтовом сообщении нужно указать имя компьютера-получателя и точное наименование почтового ящика.
Аргументом команды MAIL является обратный маршрут, включающий имя источника сообщения и имена всех промежуточных агентов. Аргумент команды RCPT - маршрут доставки, содержащий имя получателя сообщения. Обратный маршрут описывает путь, который прошло сообщение, тогда как маршрут доставки идентифицирует место назначения. Обратный маршрут используется SMTP, когда нужно передать сообщение о случившейся ошибке или о невозможности доставить сообщение, когда оно уже прошло через промежуточный агент. По мере продвижения сообщения по Internet записи о его маршрутах изменяются. В обязанности системных администраторов входит правильно настраивать местные МТА на передачу сообщений промежуточному агенту, и наоборот, промежуточные агенты на доставку сообщений местным MTA. Если у промежуточного МТА изменится имя, то в конфигурации местного МТА нужно изменить имя компьютера в системе DNS. Другие параметры конфигурации не изменяются.
Рассмотрим почтовую транзакцию между промежуточными агентами SMTP. До того как сообщение будет передано следующему указанному в маршруте (в поле ТО:) компьютеру, имя данного компьютера удаляется из маршрута доставки и добавляется в начало обратного маршрута. К тому моменту, когда сообщение достигнет пункта назначения, маршрут доставки будет содержать только имя почтового ящика.
Усовершенствования электронной почты
Усилия по усовершенствованию электронной почты прилагаются в трех направлениях. Они затрагивают доставку (организация информации в служебных полях упаковки сообщения), обработку агентами пользователя (информация в заголовке сообщения) и тело сообщения. Наиболее интересные возможности предоставляет модификация тела почтового сообщения. Тело сообщения может переносить мультимедиа-объекты, то есть являться двоичным файлом с графической, звуковой или видеоинформацией.В этом разделе рассматриваются существующие методы кодирования таких данных в почтовых сообщениях Internet.
Расширения SMTP
Расширенный SMTP (ESMTP, Extended SMTP) работает почти так же, как и обычный SMTP, однако, команда-приветствие у него другая: EHLO (Extended hello) вместо HELO. Чтобы выяснить, поддерживает ли МТА-сервер спецификацию ESMTP, МТА-клиент посылает команду EHLO. Если сервер поддерживает ESMTP, он отвечает кодом 250. Если нет, следует сообщение о синтаксической ошибке. В ответ на сообщение об ошибке, клиент может выдать обычную команду HELO и далее выполнять стандартные операции SMTP. Если сервер умеет обслуживать ESMTP, в ответ на приветствие, как правило, он выдает многострочный ответ. Каждая срока ответа содержит дополнительную команду ESMTP, с которой сервер знает, как работать. Пример реакции ESMTP-сервера в ответ на команду EHLO:
250-mail.server.com
250-EXPN
250-HELP
250 TURN
Вторая, третья и четвертая строки ответа содержат названия дополнительных команд сервера. Этот сервер обеспечивает обработку перечисленных в табл. 1 дополнительных команд. Первыми шестью расширениями SMTP являются команды: ЕXPN, HELP, TURN, SEND, SOML и SAML. Существует также расширение SIZE, позволяющее SMTP-клиенту и серверу сообщать друг другу размеры передаваемого сообщения. Если в ответе на команду EHLO присутствует ключевое слово SIZE, значит, данное расширение обрабатывается. Если клиент МТА попытается передать сообщение, превышающее предел размеров передаваемого сообщения для сервера, почтовая транзакция не состоится (закончится с ошибкой). Максимальная длина сообщения ограничивается по нескольким причинам. Основная состоит в том, что размеры жестких дисков сервера всегда ограничены, и слишком длинное сообщение может не поместиться на них. С другой стороны, свободное пространство на дисках сервера может со временем увеличиться, и это сообщение будет принято при следующей попытке. Максимальный размер сообщения следует сразу за кодом ответа 250. Например:
250 SIZE 100000000
Это пример ответа SIZE для размера в 100 Мб. Клиент MTA анализирует ответ SIZE и в случае необходимости предпринимает соответствующие действия. Дополнительно клиент может указывать длину сообщения в команде MAIL. В следующей ESMTP-команде клиент объявляет, что длина сообщения равна 500 Кб:
MAIL FROM:<happy@jamsa.com> SIZE=500000
MTA-сервер ESMTP анализирует аргумент SIZE и решает, принимать ему сообщение такой длины или сообщить об ошибке. Все это происходит еще до начала передачи. Остальные несколько расширений SMTP, в общем, подчиняются тем же правилам, что и рассмотренная только что команда SIZE. То есть команда-расширение выдается в ответе сервера по запросу клиента EHLO. Расширения можно использовать в ваших программах в соответствии со спецификацией. В некоторых случаях расширение является просто дополнительной возможностью. В других случаях расширение - дополнительный аргумент к существующей команде (как в случае рассмотренной команды SIZE).
Местным расширением является любое поле, команда или название опции, начинающееся с буквы X.
При разработке собственных расширений почтовой системы необходимо, чтобы имена всех новых объектов начинались с буквы X. Например, пользовательский вариант декодирования тела сообщения должен называться не DECODE, как можно было бы предположить, a XDECODE. SMTP-сервер организации при этом должен включить местное расширение XDECODE в список, выдаваемый по команде EHLO (с кодом ответа 250):
250 XDECODE
MIME
Система MIME - наиболее впечатляющее расширение для существующих почтовых систем. Она не предполагает вмешательства в деятельность агентов передачи почты. Два агента пользователя, понимающие MIME, могут общаться друг с другом при помощи обыкновенных МТА. В MIME к сообщению просто добавляются несколько полей заголовка:
- MIME-Version (версия MIME)
- Content-Type (тип содержимого)
- Content-Transfer-Encoding (тип кодировки содержимого)
- Content-ID (идентификатор содержимого)
- Content-Description (описание содержимого)
Номера версий MIME меняются по мере его развития. Поле MIME-Version задает номер версии расширения MIME, которое данный агент пользователя умеет обрабатывать. Номер версии в заголовке предохраняет агента от неправильной интерпретации сообщения, в случае, если версии MIME сообщения агента не совпадают. Вот образец полей заголовка MIME-Version и Content-Type:
Mime-Version: 1.О
Content-Type: TEXT/PLAIN; charset=US-ASCII
В этом примере сообщение создано MIME версии 1.0. Тип содержимого – TEXT, подтип - PLAIN, кодовая таблица (набор символов) US-ASCII.
Таблица 4
Существующие типы и подтипы MIME
| Тип | Подтип | Описание |
| Text | Plain | Неформатированный текст. |
| Richtext | Текст с элементами форматирования и выделениями, например с курсивом, подчеркиваниями, жирными буквами и т.д. | |
| Enriched | Усовершенствованный и упрощенный вариант подтипа richtext. | |
| Multipart | Mixed | Тело сообщения состоит из нескольких частей; обрабатывать последовательно. |
| Parallel | Тело сообщения состоит из нескольких частей; обрабатывать параллельно. | |
| Digest | Дайджест электронной почты. | |
| Alternative | Тело сообщения состоит из нескольких частей; все части семантически идентичны. | |
| Message | RFC822 | В теле содержится почтовое сообщение стандарта RFC 822. |
| Partial | Фрагмент почтового сообщения. | |
| External-Body | Указатель на действительное почтовое сообщение (не включенное в тело данного сообщения). | |
| Application | Octet-Stream | Произвольные двоичные данные. |
| Postscript | Программа на языке Postscript. | |
| Image | JPEG | Формат ISO 10918. |
| GIF | Графический формат фирмы Compuserve. | |
| Audio | Basic | Звук в 8-битном ISDN-формате mu-law. |
| Video | MPEG | Формат ISO11172 |
Поля заголовка Content-ID и Content-Description могут отсутствовать. Первое служит для идентификации MIME-содержимого электронного письма, а второе может содержать дополнительное описание. Например, если MIME-содержимым является графический образ, в поле Content-Description можно поместить описание этого образа. В табл. 5 перечислены возможные значения Content-Transfer-Encoding, доступные в настоящее время.
Допустимые значения поля Content-Tfansfer-Encoding
| Content-Transfer-Encoding | Описание |
| 7bit | Формат NVT-ASCII – стандартный формат почтовых сообщений. |
| Quoted-printable | Полезен в случае, если текст содержит небольшое количество восьмибитных символов. |
| Base64 | Формат, в котором три байта данных упакованы в четыре шестибитных значения. |
| 8bit | Содержит текст, в котором не все символы принадлежат стандартному набору ASCII (то есть в некоторых установлен восьмой бит). |
| Binary | Восьмибитные данные без символов окончания строки. |
По умолчанию формат почтовых сообщений удовлетворяет кодовому набору NVT-ASCII. 8-битные агенты МТА сейчас практически отсутствуют, но как только они получат широкое распространение, вероятно, передача бинарной и текстовой информации в 8-битной кодировке возрастет. В настоящий момент для передачи 8-битной информации по 7-битным каналам Internet лучше всего использовать кодировки quoted-printable или base64.
Способы кодирования MIME
Для кодирования небольшого количества 8-битных данных в 7-битный формат NVT ASCII лучше всего подходит схема quoted printable. 8-битный символ в этой схеме представляется в виде последовательности из трех символов. Последовательность всегда начинается со знака “равно” (=). Сразу за знаком “равно” следует двузначное шестнадцатиричное число, представляющее код ASCII кодируемого символа. Рассмотрим закодированную quoted printable последовательность JAMSA PRESS. Хоть она и не содержит 8-битных символов, зато позволяет хорошо проиллюстрировать принцип кодирования. Закодированное сочетание JAMSA PRESS выглядит так:
=4A=41=4D=53=41=20=50=52=45=53=53Другими словами, буква J имеет шестнадцатиричный код ASCII 0x4A, буква А – 0х41 и т.д. Схема quoted printable передает ASCII код для каждого символа последовательности. То есть для знака А (ASCII 0x4A) передается код знака “равно” (ASCII 0x3D), код цифры 4 (ASCII 0x34) и код знака А (0х41). Данную схему довольно удобно использовать, но она утраивает общее количество информации в сообщении. Таким образом, область применения quoted printable – сообщение с небольшим количеством символов, в которых установлен старший (восьмой) бит. Основная часть сообщения должна состоять обычных семибитных символов.
В отличие от quoted printable, кодирование Base-64 увеличивает размер сообщения всего лишь на одну треть. Каждая последовательность из трех байтов (24 бита) превращается в четыре шестибитовых (тоже 24 бита). Шестибитные символы соответствуют формату NVT ASCII и приведены в
| 6 бит | ASCII | 6 бит | ASCII | 6 бит | ASCII | 6 бит | ASCII |
| 0 | A | 16 | Q | 32 | g | 48 | w |
| 1 | B | 17 | R | 33 | h | 49 | x |
| 2 | C | 18 | S | 34 | i | 50 | y |
| 3 | D | 19 | T | 35 | j | 51 | z |
| 4 | E | 20 | U | 36 | k | 52 | 0 |
| 5 | F | 21 | V | 37 | l | 53 | 1 |
| 6 | G | 22 | W | 38 | m | 54 | 2 |
| 7 | H | 23 | X | 39 | n | 55 | 3 |
| 8 | I | 24 | Y | 40 | o | 56 | 4 |
| 9 | J | 25 | Z | 41 | p | 57 | 5 |
| 10 | K | 26 | a | 42 | q | 58 | 6 |
| 11 | L | 27 | b | 43 | r | 59 | 7 |
| 12 | M | 28 | c | 44 | s | 60 | 8 |
| 13 | N | 29 | d | 45 | t | 61 | 9 |
| 14 | O | 30 | e | 46 | u | 62 | + |
| 15 | P | 31 | f | 47 | v | 63 | / |
Если количество байтов (символов) в сообщении не кратно трем, используются дополняющие символы “равно”. Например, слово KEN в формате Base-64 выглядит как “S0VO” (дополнительных символов не требуется). Слово COPE в формате Base-64 выглядит как “Q09QRQ==” (требуются два дополнительных символа-нуля). Слово JAMSA в формате Base-64 выглядит как “SkFNU0E=” (требуется один дополнительный символ-ноль).
Реализации метода Base-64
Далее рассмотрен процесс кодирования слова KEN методом Base-64. Описания участвующих в процессе переменных:BYTE cTemp, cTempHigh, cTempLow;
BYTE cFirst6Bits, cSecond6Bits;
BYTE cThird6Bits, cFourth6Bits;
BYTE cFirstLetter = ‘K’;
BYTE cSecondLetter = ‘E’;
BYTE cThirdLetter = ‘N’;
Кодирование данных по методу Base-64
Операторы языка C/C++, реализующие способ кодирования Base-64:
cFirst5Bits = cFirthLetter >> 2; (1)
cTemp = cFirstLetter << 4; (2A)
cTempHigh = cTemp & 0x30; (2B)
cTempLow = cSecondLetter >> 4; (2C)
cSecond6Bits = cTempHigh | cTempL w; (2D)
cTemp = cSecondLetter << 2; (3A)
cTempHigh = cTemp & 0x3C; (3B)
cTempLow = cThirdLetter >> 6; (3C)
cThird6Bits = cTempHigh | c TempLow; (3D)
cFourth6Bits = cThirdLetter & 0x3F; (4)
Первым делом биты переменной сFirstLetter (символа K) сдвигаются вправо на две позиции. Получается новый байт, содержащий первые шесть бит нашей последовательности. Далее полученное значение записывается в переменную cFirst6Bits. Дальше, чтобы получить следующее значение, нужно объединить два младших бита первого символа (K) с четырьмя старшими второго (E), т.е. нужно переместить первый и второй биты буквы K на позиции 5 и 6 – они будут старшими битами следующего шестибитного символа. Операция 2А, двоичный сдвиг влево на четыре позиции демонстрирует, как это делается. Результат сдвига запоминается во вспомогательной переменной cTemp.
Сдвиг оператором 2А очищает позиции с 1 по 4, а биты 3 и 4 буквы K теперь расположены на позициях 7 и 8. Позиции 7 и 8 необходимо очистить, поскольку нам нужны только первые шесть битов нового символа. Для этого выполняется оператор 2В, “двоичное И”. Битовая маска 00110000 (0х30) очищает все позиции, кроме пятой и шестой (в них содержатся интересующие нас данные). Поскольку биты 5 и 6 теперь старшие для нового символа Base-64, результат помещается (оператором 2В) во вспомогательную переменную cTempHigh.
В результате оператора 2В имеется два старших бита нового шестибитного символа. Биты с 1 по 4 должны быть взяты из второго символа. Чтобы получить четыре бита из второго символа, его содержимое сдвигается вправо на четыре позиции (оператор 2С). Результат оператора 2 С помещается во вспомогательную переменную cTempLow. Теперь в переменной cTempLow хранятся четыре младших бита нового символа, а в переменной cTempHigh — два старших. Для того чтобы их скомбинировать, мы используем оператор (2D) двоичного ИЛИ. Результат операции заносится в переменную cSecond6Bits.
В третий шестибитный символ должны попасть четыре младших бита символа Е и два старших бита символа N. То есть нужно переместить четыре младших бита символа Е с позиций 1 - 4 на позиции 3 - 6. Для этого оператор 3А сдвигает биты влево на две позиции и помещает результат в переменную сТеmр. Сдвиг влево очищает позиции 1 и 2 для следующих данных. Кроме того, необходимо убедиться, что позиции 7 и 8 тоже свободны. Другими словами, нам нужны только биты в позициях 3 - 6. Чтобы очистить ненужные и оставить нужные позиции, выполняется оператор “двоичное И” с маской 00111100 (0х3С). Результат оператора 3В помещается в переменную cTempHigh.
Далее два старших бита символа N необходимо сдвинуть на позиции 1 и 2. Для этого выполняется оператор ЗС сдвига вправо на 6 позиций. Результат заносится в переменную cTempLow. Теперь у нас есть четыре младших бита символа Е в переменной cTempHigh и два старших бита символа N в переменной cTempLow. Оператор 3D комбинирует значения двух этих переменных при помощи двоичного сложения (ИЛИ) и помещает новое шестибитное значение в переменную cThird6Bits. Теперь получить четвертое шестибитное значение становится просто, т.к. все биты уже стоят на своих позициях с 1 по 6 в символе N. Осталось маскировать значения битов позиций 7 и 8. Оператор 4 выполняет “двоичное И” с маской 00111111 (Ox3F) и заносит результат в переменную cFourth6Bits.
Операторы языка C/C++, реализующие способ декодирования Base-64:
cTempHigh = cFirst6Bits << 2; (5A)
cTempLow = cSecond6Bits >> 4; (5B)
cFirstLetter = cTempHigh | cTempLow; (5C)
cTempHigh = cSecond6Bits << 4; (6A)
cTempLow = cThird6Bits >> 2; (6B)
cSecondLetter = cTempHigh | cTempLow; (6C)
cTempHigh = cThird6Bits << 6; (7A)
cThirdLetter = cTempHigh | cFourth6Bits; (7B)
Значения полученных четырех шестибитных символов формата Base-64 хранятся в переменных cFirst6Bits, cSecond6Bits, cThird6Bits и cFourth6Bits. Операторы с 5А по 7В демонстрируют, как декодировать эти значения. Чтобы получить каждый байт (кроме третьего) в последовательности, производятся операции левого сдвига, правого сдвига и битового ИЛИ. (Для третьего символа правый сдвиг не нужен - требуются только левый сдвиг битовое ИЛИ.) Ключевой момент - знать, на сколько позиций сдвигать в каждом направлении. Шесть битов первого символа Base-64 являются старшими шестью битами первого байта данных. Их необходимо переместить с позиций 1 - 6 на позиции 3 - 8. Для этого выполняется операция сдвига влево на две позиции (оператор 5А). Поскольку эти биты старшие, результат заносится в переменную cTempHigh. Теперь требуются биты с позиций 5 и 6 из второго символа Base-64. В них занесены два младших бита первого байта данных. Сдвиг вправо на четыре позиции оператором 5В решает проблему. Результат оператора 5В заносится в переменную cTempLow. Теперь есть шесть старших битов в переменной cTempHigh и два младших бита в переменной cTempLow. Oператор 5С, битовое ИЛИ, комбинирует их значения, и в результате получается первый байт данных.
Чтобы получить второй байт данных, выполняются практически те же операторы. Только вместо сдвига влево на два и сдвига вправо на четыре делается сдвиг влево на четыре, а вправо на два, как продемонстрировано операторами 6А и 6В. Оператор 6С, битовое ИЛИ, комбинирует полученные результаты операторов 6А и 6В и получает значение второго байта данных. Биты с 1 по 6 четвертого символа Base-64 соответствуют младшим битам третьего символа данных. Биты 7 и 8 символа данных содержатся на позициях 1 и 2 третьего символа Base-64. Поэтому значение третьего символа сдвигается вправо на шесть позиций оператором 7А. Наконец, в результате оператора 7В, битовое ИЛИ, получается третий байт данных.
Реализация алгоритма
Метод кодирования Base-64 оперирует с 24-битными величинами. Алгоритмы кодирования и декодирования также оперируют 24-битными величинами. Другими словами, хотя в предыдущем разделе и не рассматривались прототипы функций для кодирования-декодирования Base-64, предполагалось, что у них 24-битные аргументы. Алгоритм кодирования состоит из десятка очень быстрых (поскольку все они работают с двоичной информацией) операторов, преобразующих три байта данных в четыре шестибитных символа Base-64 и восьми строк с такими же быстрыми операторами, преобразующими эти символы в три 8-битных символа исходных данных.
Протокол доставки почты (POP)
Post Office Protocol (POP) - протокол доставки почты пользователю из почтового ящика. Многие концепции, принципы и понятия протокола POP аналогичны SMTP. Команды POP практически идентичны командам SMTP, отличаясь в некоторых деталях.
В настоящее время существуют две версии протокола POP – РОР2 и РОРЗ. Обе версии обладают примерно одинаковыми возможностями, однако, несовместимы друг с другом. Дело в том, что у РОР2 и РОРЗ разные номера портов протокола. Между ними отсутствует связь, аналогичная связи между SMTP и ESMTP. Протокол РОРЗ не является расширением или модификацией РОР2 - это совершенно другой протокол. РОР2 тесно связан с протоколом SMTP. Набор и структура команд РОР2 параллельны набору и структуре команд SMTP. РОРЗ, однако, разработан с учетом специфики доставки почты на персональные компьютеры и соответствующих операций.
Раньше почтовые сообщения большинства сетей доставлялись непосредственно от одного компьютера к другому. Если пользователь часто менял рабочие компьютеры или один компьютер принадлежал нескольким пользователям, существовали определенные проблемы. В настоящее время большинство систем электронной почты доставляют сообщения не на отдельные компьютеры, а в специальные потовые ящики, находящиеся на почтовом сервере. Для того, чтобы прочитать свою почту, пользователю необходимо войти в сеть и получить доступ к почтовому серверу. Данный процесс достаточно сложен для начинающих пользователей, удаленный вход часто запрещается администраторами по соображениям безопасности, и, вдобавок ко всему, чтобы прочесть или отослать почту, нужно было пользоваться почтовым агентом самого сервера. Специальный протокол доставки почты POP и стал альтернативой всем вышеописанным проблемам.
Протокол РОРЗ
Конструкция протокола РОРЗ обеспечивает возможность пользователю войти в систему и изъять накопившуюся почту, вместо того чтобы предварительно входить в сеть. Пользователь получает доступ к РОР-серверу из любой системы в Internet. При этом он должен запустить специальный почтовый агент (UA), понимающий протокол РОРЗ. Во главе модели POP находится отдельный персональный компьютер, работающий исключительно в качестве клиента почтовой системы. В соответствии с этой моделью персональный компьютер не занимается ни доставкой, ни авторизацией сообщений для других. Также сообщения доставляются клиенту по протоколу POP, а посылаются по-прежнему при помощи SMTP. То есть на компьютере пользователя существуют два отдельных агента-интерфейса к почтовой системе - доставки (POP) и отправки (SMTP). Разработчики протокола РОРЗ называет такую ситуацию “раздельные агенты” (split UA).
В протоколе РОРЗ оговорены три стадии процесса получения почты: авторизация, транзакция и обновление. После того как сервер и клиент РОРЗ установили соединение, начинается стадия авторизации. На стадии авторизации клиент идентифицирует себя для сервера. Если авторизация прошла успешно, сервер открывает почтовый ящик клиента и начинается стадия транзакции. В ней клиент либо запрашивает у сервера информацию (например, список почтовых сообщений), либо просит его совершить определенное действие (например, выдать почтовое сообщение). Наконец, на стадии обновления сеанс связи заканчивается.
Команды протокола POP версии 3 (для минимальной конфигурации)
| Команда | Описание |
| USER | Идентифицирует пользователя с указанным именем |
| PASS | Указывает пароль для пары клиент-сервер |
| QUIT | Закрывает TCP-соединение |
| STAT | Сервер возвращает количество сообщений в почтовом ящике плюс размер почтового ящика |
| LIST | Сервер возвращает идентификаторы сообщений вместе с размерами сообщений (параметром команды может быть идентификатор сообщения) |
| RETR | Извлекает сообщение из почтового ящика (требуется указывать аргумент-идентификатор сообщения) |
| DELE | Отмечает сообщение для удаления (требуется указывать аргумент-идентификатор сообщения) |
| NOOP | Сервер возвращает положительный ответ, но не совершает никаких действий |
| LAST | Сервер возвращает наибольший номер сообщения из тех, к которым ранее уже обращались |
| RSET | Отменяет удаление сообщения, отмеченного ранее командой DELE |
В протоколе POР3 определено несколько команд, но на них дается только два ответа: +OK (позитивный, аналогичен сообщению-подтверждению АСК) и -ERR (негативный, аналогичен сообщению “не подтверждено” NAK). Оба ответа подтверждают, что обращение к серверу произошло и что он вообще отвечает на команды. Как правило, за каждым ответом следует его содержательное словесное описание. Сейчас будут рассмотрены несколько типичных сеансов РОРЗ, что даст возможность уловить последовательность команд в обмене между сервером и клиентом.
Авторизация пользователяПосле того, как программа установила TCP-соединение с портом протокола РОРЗ (официальный номер 110), необходимо послать команду USER с именем пользователя в качестве параметра. Если ответ сервера будет +OK, нужно послать команду PASS с паролем этого пользователя:
CLIENT: USER kcope
SERVER: +OK
CLIENT: PASS secret
SERVER: +OK kcope's maildrop has 2 messages (320 octets)
...
(B почтовом ящике kcope есть 2 сообщения (320 байтов) ...)
После того, как стадия авторизации окончена, обмен переходит на стадию транзакции. В следующих примерах демонстрируется возможный обмен сообщениями на этой стадии. Команда STAT возвращает количество сообщений и количество байтов в сообщениях:
CLIENT: STAT
SERVER: +ОК 2 320
Команда LIST (без параметра) возвращает список сообщений в почтовом ящике и их размеры:
CLIENT: LIST
SERVER: +ОК 2 messages (320 octets)
SERVER: 1 120
SERVER: 2 200
SERVER: . ...
Команда LIST с параметром возвращает информацию о заданном сообщении:
CLIENT: LIST 2
SERVER: +ОК 2 200 ...
CLIENT: LIST 3
SERVER: -ERR no such message, only 2 messages in maildrop
Команда TOP возвращает заголовок, пустую строку и первые десять строк тела сообщения:
CLIENT: TOP 10
SERVER: +OK
SERVER: <the POP3 server sends the headers of the message,
a blank line, and the first 10 lines of the message body>
(сервер POP высылает заголовки сообщений, пустую строку и первые десять строк тела сообщения)
SERVER: . ...
CLIENT: TOP 100
SERVER: -ERR no such message
Команда NOOP не возвращает никакой полезной информации, за исключением позитивного ответа сервера. Однако, позитивный ответ означает, что сервер находится в соединении с клиентом и ждет запросов:
CLIENT: NOOP
SERVER: +OK
Следующие примеры показывают, как сервер POP3 выполняет действия. Например, команда RETR извлекает сообщение с указанным номером и помещает его в буфер местного UA:
CLIENT: RETR 1
SERVER: +OK 120 octets
SERVER: <the POP3 server sends the entire message here>
(РОРЗ-сервер высылает сообщение целиком)
SERVER: .
Команда DELE отмечает сообщение, которое нужно удалить:
CLIENT: DELE 1
SERVER: +OK message 1 deleted...
(сообщение 1 удалено)
CLIENT: DELE 2
SERVER: -ERR message 2 already deleted
(сообщение 2 уже удалено)
Команда RSET снимает метки удаления со всех отмеченных ранее сообщений:
CLIENT: RSET
SERVER: +OK maildrop has 2 messages (320 octets)
(в почтовом ящике 2 сообщения (320 байтов))
Команда QUIT закрывает соединение с сервером:
CLIENT: QUIT
SERVER: +OK dewey POP3 server signing off
CLIENT: QUIT
SERVER: +OK dewey POP3 server signing off (maildrop empty)
...
CLIENT: QUIT
SERVER: +OK dewey POP3 server signing off (2 messages left) ...
Отмеченные для удаления сообщения не удаляются до тех пор, пока не выдана команда QUIT и не началась стадия обновления. В любой момент в течение сеанса клиент имеет возможность выдать команду RSET, и все отмеченные для удаления сообщения будут восстановлены.