新书推介:《语义网技术体系》
作者:瞿裕忠,胡伟,程龚
   XML论坛     W3CHINA.ORG讨论区     计算机科学论坛     SOAChina论坛     Blog     开放翻译计划     新浪微博  
 
  • 首页
  • 登录
  • 注册
  • 软件下载
  • 资料下载
  • 核心成员
  • 帮助
  •   Add to Google

    >> XML与各种文件格式的相互转换及相关工具。 word to xml, xml to word, html to xml, xml to pdf,
    csv to xml, rtf to xml, text to xml, xml to text, xls to xml, xml to xls
    FOP
    [返回] 中文XML论坛 - 专业的XML技术讨论区XML.ORG.CN讨论区 - XML技术『 WORD to XML, HTML to XML 』 → 请教大家如何用vb将word文件转换成xml文件呢? 查看新帖用户列表

      发表一个新主题  发表一个新投票  回复主题  (订阅本版) 您是本帖的第 13067 个阅读者浏览上一篇主题  刷新本主题   树形显示贴子 浏览下一篇主题
     * 贴子主题: 请教大家如何用vb将word文件转换成xml文件呢? 举报  打印  推荐  IE收藏夹 
       本主题类别:     
     hero5180 帅哥哟,离线,有人找我吗?
      
      
      等级:大一新生
      文章:2
      积分:62
      门派:XML.ORG.CN
      注册:2006/4/24

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给hero5180发送一个短消息 把hero5180加入好友 查看hero5180的个人资料 搜索hero5180在『 WORD to XML, HTML to XML 』的所有贴子 引用回复这个贴子 回复这个贴子 查看hero5180的博客楼主
    发贴心情 请教大家如何用vb将word文件转换成xml文件呢?

    具体要求如下:

    1. 目标

    将一定格式的 word 文件转换成一定格式的 xml 文件,该 xml 文件可以用 XSLT 显示成 html 格式。

      

    2. 源文件

    在 source 目录下,有多个 word 文件,文件名为源文件 -x.doc

    每个文件的格式都是相同的,包括多个以下的两类内容:

    <INFO_X>

    This is the content of INFO_X.

      

    <ID_X>

    This is the content of ID_X.

      

    要求把文件转换成 xml 格式。在 xml 文件里,要求转换成相应的

    <INFO_X>

           This is the content of ID_X with html format.

    </INFO_X>

      

    <ID_X>

           <HTML>

                  This is the content of ID_X with html format.

           </HTML>

    </ID_X>

      

    对 <INFO> 中的内容,不需要保存格式。对 <ID_X> 中的内容,要保存 HTML 格式。在 word 格式里,可能包含有图像文件或其他的对象。

      

    3. 目标文件

    在 source 目录下,建立相应的 xml 文件,文件名为源文件 -x.doc.xml


    在 xml 文件中,第一行应为

    <?xml  version="1.0"?>
    其余的内容对应 word 文件的内容。对于源文件中的图像和公式等对象,可以用 html 的 <img> 标识指向子目录下的图形文件。

    在 <html></html> 之间,不能含有 <head></head> 标识,只能有 <body></body> 的内容。在 <body></body> 内,需要将 html 的格式保存下来。

      

    4 . XSLT 文件

    生成一个 XSLT 文件,将目标文件在 IE 浏览器内显示,其中不显示 <INFO_X>  标识和内容,以及 <ID_X> 的标识。

      
    希望大家能够帮我看看~!


       收藏   分享  
    顶(0)
      




    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2006/4/24 18:56:00
     
     hero5180 帅哥哟,离线,有人找我吗?
      
      
      等级:大一新生
      文章:2
      积分:62
      门派:XML.ORG.CN
      注册:2006/4/24

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给hero5180发送一个短消息 把hero5180加入好友 查看hero5180的个人资料 搜索hero5180在『 WORD to XML, HTML to XML 』的所有贴子 引用回复这个贴子 回复这个贴子 查看hero5180的博客2
    发贴心情 
    怎么无人问津列
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2006/4/27 12:17:00
     
     hero5180 帅哥哟,离线,有人找我吗?
      
      
      等级:大一新生
      文章:2
      积分:62
      门派:XML.ORG.CN
      注册:2006/4/24

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给hero5180发送一个短消息 把hero5180加入好友 查看hero5180的个人资料 搜索hero5180在『 WORD to XML, HTML to XML 』的所有贴子 引用回复这个贴子 回复这个贴子 查看hero5180的博客3
    发贴心情 
    怎么用vb将word文件直接生成html文件,然后再将html文件转换成相应的xml文件和XSLT文件呢?
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2006/4/27 12:55:00
     
     ludahai 帅哥哟,离线,有人找我吗?
      
      
      等级:大一新生
      文章:13
      积分:94
      门派:XML.ORG.CN
      注册:2004/9/30

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给ludahai发送一个短消息 把ludahai加入好友 查看ludahai的个人资料 搜索ludahai在『 WORD to XML, HTML to XML 』的所有贴子 引用回复这个贴子 回复这个贴子 查看ludahai的博客4
    发贴心情 
    vb.net,用xmldocument类
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2006/6/26 10:29:00
     
     GoogleAdSense
      
      
      等级:大一新生
      文章:1
      积分:50
      门派:无门无派
      院校:未填写
      注册:2007-01-01
    给Google AdSense发送一个短消息 把Google AdSense加入好友 查看Google AdSense的个人资料 搜索Google AdSense在『 WORD to XML, HTML to XML 』的所有贴子 访问Google AdSense的主页 引用回复这个贴子 回复这个贴子 查看Google AdSense的博客广告
    2024/11/25 12:32:37

    本主题贴数4,分页: [1]

    管理选项修改tag | 锁定 | 解锁 | 提升 | 删除 | 移动 | 固顶 | 总固顶 | 奖励 | 惩罚 | 发布公告
    W3C Contributing Supporter! W 3 C h i n a ( since 2003 ) 旗 下 站 点
    苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
    78.125ms