利用php 将html 转成wml WAP标志语言

WML(无线标志语言,Wireless Markup Language)是一种剧本语言, 它比HTML 编写的内容要耗损网络欣赏器更少的内存和CPU时间, 使得WML对广域网和移动设备来说越发友好。

WML 是无线标志语言。它是一种从 HTML 担任而来的标志语言,可是 WML 基于 XML,因此它较 HTML 更严格。

因为也是基于xml 应该可以由html转成wap ,cms中的源码,有个将html转成wml的php函数,貌似正则也挺多的,贴出来。

<?php //--------------------------------------- // Html 标志WAP语言 //---------------------------------------- function html2wml($content) { //保存图片 preg_match_all("/<img([^>]*)>/isU", $content, $imgarr); if(isset($imgarr[0]) && count($imgarr[0])>0 ) { foreach($imgarr[0] as $k=>$v) $content = str_replace($v, "WAP-IMG::{$k}", $content); } // 过滤掉样式表和剧本 $content = preg_replace("/<style .*?<\/style>/is", "", $content); $content = preg_replace("/<script .*?<\/script>/is", "", $content); // 首先将各类可以引起换行的标签(如<br />、<p> 之类)替换成换行符"\n" $content = preg_replace("/<br \s*\/?\/>/i", "\n", $content); $content = preg_replace("/<\/?p>/i", "\n", $content); $content = preg_replace("/<\/?td>/i", "\n", $content); $content = preg_replace("/<\/?div>/i", "\n", $content); $content = preg_replace("/<\/?blockquote>/i", "\n", $content); $content = preg_replace("/<\/?li>/i", "\n", $content); // 将"&nbsp;"替换为空格 $content = preg_replace("/\&nbsp\;/i", " ", $content); $content = preg_replace("/\&nbsp/i", " ", $content); // 过滤掉剩下的 HTML 标签 $content = strip_tags($content); // 将 HTML 中的实体(entity)转化为它所对应的字符 $content = html_entity_decode($content, ENT_QUOTES, "GB2312"); // 过滤掉不能转化的实体(entity) $content = preg_replace('/\&\#.*?\;/i', '', $content); // 上面是将 HTML 网页内容转化为带换行的纯文本,下面是将这些纯文本转化为 WML。 $content = str_replace('$', '$$', $content); $content = str_replace("\r\n", "\n", htmlspecialchars($content)); $content = explode("\n", $content); for ($i = 0; $i < count($content); $i++) { $content[$i] = trim($content[$i]); // 假如去掉全角空格为空行,则设为空行,不然差池全角空格过滤。 if (str_replace(' ', '', $content[$i]) == '') $content[$i] = ''; } $content = str_replace("<p><br /></p>\n", "", '<p>'.implode("<br /></p>\n<p>", $content)."<br /></p>\n"); //还原图片 if(isset($imgarr[0]) && count($imgarr[0])>0 ) { foreach($imgarr[0] as $k=>$v) { $attstr = (preg_match('#/$#', $imgarr[1][$k])) ? '<img '.$imgarr[1][$k].'>' : '<img '.$imgarr[1][$k].' />'; $content = str_replace("WAP-IMG::{$k}", $attstr, $content); } } $content = preg_replace("/&amp;[a-z]{3,10};/isU", ' ', $content); return $content; } function text2wml($content) { $content = str_replace('$', '$$', $content); $content = str_replace("\r\n", "\n", htmlspecialchars($content)); $content = explode("\n", $content); for ($i = 0; $i < count($content); $i++) { // 过滤首尾空格 $content[$i] = trim($content[$i]); // 假如去掉全角空格为空行,则设为空行,不然差池全角空格过滤。 if (str_replace(" ", "", $content[$i]) == "") $content[$i] = ""; } //归并各行,转化为 WML,并过滤掉空行 $content = str_replace("<p><br /></p>\n", "", "<p>".implode("<br /></p>\n<p>", $content)."<br /></p>\n"); return $content; } ?>

end....

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:https://www.heiqu.com/7790.html