Как почистить HTML из документов MS Office?

by Dmitry [dimaka] Pavlov 11. April 2011 00:28

Вы наверное замечали, что когда Вы сохраняете документы Word или Excel в виде HTML, то в них очень много всяких стилей, которые отвечают за внешний вид текста, таблиц и т.п.

Например, вот так выглядит предыдущий абзац в HTML:

<p style='line-height:12.75pt;background:white'><span lang=RU style='font-size:
9.0pt;font-family:"Tahoma","sans-serif";color:#444444;mso-ansi-language:RU'>Вы
наверное замечали, что когда Вы сохраняете документы </span><span lang=EN
style='font-size:9.0pt;font-family:"Tahoma","sans-serif";color:#444444;
mso-ansi-language:EN'>Word</span><span lang=RU style='font-size:9.0pt;
font-family:"Tahoma","sans-serif";color:#444444;mso-ansi-language:RU'> или </span><span
lang=EN style='font-size:9.0pt;font-family:"Tahoma","sans-serif";color:#444444;
mso-ansi-language:EN'>Excel</span><span lang=RU style='font-size:9.0pt;
font-family:"Tahoma","sans-serif";color:#444444;mso-ansi-language:RU'> в виде </span><span
lang=EN style='font-size:9.0pt;font-family:"Tahoma","sans-serif";color:#444444;
mso-ansi-language:EN'>HTML</span><span lang=RU style='font-size:9.0pt;
font-family:"Tahoma","sans-serif";color:#444444;mso-ansi-language:RU'>, то в
них очень много всяких стилей, которые отвечают за внешний вид текста, таблиц и
т.п. <o:p></o:p></span></p>

Для того чтобы ‘почистить’ HTML можно воспользоваться онлайн сервисом Word Off . org. Вот так выглядит интерфейс сервиса:

word.off.before

Tags: ,

по-русски | Web | Tips | Tricks | Coding | Developer Tools | HTML

Calendar

<<  May 2012  >>
MoTuWeThFrSaSu
30123456
78910111213
14151617181920
21222324252627
28293031123
45678910

View posts in large calendar