by Dmitry [dimaka] Pavlov
11. April 2011 00:28
Вы наверное замечали, что когда Вы сохраняете документы Word или Excel в виде HTML, то в них очень много всяких стилей, которые отвечают за внешний вид текста, таблиц и т.п.
Например, вот так выглядит предыдущий абзац в HTML:
<p style='line-height:12.75pt;background:white'><span lang=RU style='font-size:
9.0pt;font-family:"Tahoma","sans-serif";color:#444444;mso-ansi-language:RU'>Вы
наверное замечали, что когда Вы сохраняете документы </span><span lang=EN
style='font-size:9.0pt;font-family:"Tahoma","sans-serif";color:#444444;
mso-ansi-language:EN'>Word</span><span lang=RU style='font-size:9.0pt;
font-family:"Tahoma","sans-serif";color:#444444;mso-ansi-language:RU'> или </span><span
lang=EN style='font-size:9.0pt;font-family:"Tahoma","sans-serif";color:#444444;
mso-ansi-language:EN'>Excel</span><span lang=RU style='font-size:9.0pt;
font-family:"Tahoma","sans-serif";color:#444444;mso-ansi-language:RU'> в виде </span><span
lang=EN style='font-size:9.0pt;font-family:"Tahoma","sans-serif";color:#444444;
mso-ansi-language:EN'>HTML</span><span lang=RU style='font-size:9.0pt;
font-family:"Tahoma","sans-serif";color:#444444;mso-ansi-language:RU'>, то в
них очень много всяких стилей, которые отвечают за внешний вид текста, таблиц и
т.п. <o:p></o:p></span></p>
Для того чтобы ‘почистить’ HTML можно воспользоваться онлайн сервисом Word Off . org. Вот так выглядит интерфейс сервиса:
