首页 > 开发 > PHP > 正文

phpword插件导出word文件时中文乱码问题处理方案

2024-05-04 22:19:20
字体:
来源:转载
供稿:网友

最近一个项目开发要用到PHP技术导出Word文档,比较了几种方案,首先是使用Microsoft Office自带的ActiveX/COM组件,比如Word.Application,这种方式的优点是格式兼容度高,可以生成纯doc的Word2003格式文档,缺点一是比较占资源(调用会启动一个WINWORD.EXE进程),不适合Web多用户访问使用;二是PHP这种Web开发技术大多数是跑在Linux服务器上,当然也就无法使用Windows下的技术了,平台可移植和兼容性不好。

第二种生成Word的方案是生成Word兼容的网页格式,然后以Word方式打开,这种方案总体上感觉怪怪的,毕竟文件格式是HTML的,而且格式兼容度不好,不过这种方式的优点是节省服务器资源,能够快速生成;最后一种方案也就是今天的主角,采用PHPWord生成Word2007(docx)格式的文档,现在基本上微软Office Word 2003以后的版本均兼容这种格式了,对于2003版本来说,仅需要下载安装个兼容格式包(下载地址),也能正常打开这类文件,当然如果你使用的是最新版本的Office(包括但不限于Office 2007、Office 2010)则不需要安装此格式包。

好了,下面我就介绍一下PHPWord,大家可以通过访问项目主页下载并获得关于项目的更多信息。

我在使用过程中主要遇到了中文乱码的问题,结合网上大神们的指导,通过下面的方式解决了这类问题,希望对大家有所帮助。

1、增加东亚字体支持 

打开并编辑路径/Writer/Word2007/Base.php文件内容,大概在第349行(行数随着版本可能会有变化)大概函数_writeTextStyle内添加:

$objWriter->writeAttribute('w:eastAsia', $font)
比如我的修改片段基本是下面这样:

// Fontif($font != 'Arial') {  $objWriter->startElement('w:rFonts');    $objWriter->writeAttribute('w:eastAsia', $font); // 添加这行    $objWriter->writeAttribute('w:ascii', $font);    $objWriter->writeAttribute('w:hAnsi', $font);    $objWriter->writeAttribute('w:cs', $font);  $objWriter->endElement();}

2. 解决中文乱码问题

编辑PHPWord/Template.php,找到代码$replace = utf8_encode($replace);,删除或者注释掉这行代码,添加$replace = iconv( 'gbk','utf-8', $replace);,比如代码改为如下:

 /** * Set a Template value *  * @param mixed $search * @param mixed $replace */public function setValue($search, $replace) {  if(substr($search, 0, 2) !== '${' && substr($search, -1) !== '}') {    $search = '${'.$search.'}';  }   if(!is_array($replace)) {    //$replace = utf8_encode($replace);    $replace =iconv('gbk', 'utf-8', $replace); // 注释掉上面行后添加这行  }   $this->_documentXML = str_replace($search, $replace, $this->_documentXML);}

调用方式如下:

 

$document->setValue('Template', iconv('utf-8', 'GB2312//IGNORE', '中文'));            
发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表