网站首页 > 博客 > 正文

javascript 开发语言 ecmascript 前端记录-html-docs-js避坑指南

vengomo 博客 2024-05-14 2 0

这里给大家分享我在网上总结出来的一些知识，希望对大家有所帮助

前言

我们公司目前在做基于tiptap的在线协同文档，最近需要做导出 pdf、word 需求。

导出 word 文档使用的是html-docx-js-typescript，是用 typescript 重写了一下html-docx-js，可以看到最近的提交记录是 2016 年，貌似已经不维护了，很多 Issues 没人管。

实在找不到其他的 html 转 word 的插件，最后只能使用它来处理，我把我在使用过程中遇到的问题一一列出来，就有了这篇避坑指南。

使用说明

安装安装html-docx-js-typescript，同时安装FileSaver用于浏览器端保存文件。

npm install html-docx-js-typescript file-saver --save-dev

npm install @types/html-docx-js @types/file-saver --dev

使用方法参考官方示例

使用过程遇到的问题及处理方案

字体加粗不生效、字体背景颜色不生效处理

字体加粗和标记文本元素标签需要替换为和标签

const innerHtml = cloneEle.innerHTML

// strong在word中不生效问题

.replace(//g, '')

.replace(/<\/strong>/g, '')

// 背景色不生效问题

.replace(/

.replace(/<\/mark>/g, '')

h1 - h6 标题高度优化及未同步 word 文档标题

我们文档中的标题对应的 HTML 内容长这样

需要将内容转换为类似

xxx

这样，不然 word 中编辑时不能对应标题，修改如下：
// 标题高度和字体失效需要设置lineHeight和fontWeight
const handleLevelStyle = (cloneEle: HTMLElement) => {
Array.from({ length: 6 }).forEach((_, index) =>
(cloneEle.querySelectorAll(`h${index + 1}`) as unknown as HTMLElement[]).forEach((h) => {
h.innerText = (h.children[0] as HTMLElement).innerText
h.style.fontSize = ''
})
)
}
图片下多出一个白框
Prosemiror-images上传图片后，会在图片后面生成.ProseMirror-separator这个标签，我们在导出时只需要删除它即可。
const removeWhiteBox = (cloneEle: HTMLElement) => {
const separators: NodeListOf = cloneEle.querySelectorAll(
'.ProseMirror-separator'
)
separators.forEach((separator) =>
separator.parentElement?.removeChild(separator)
)
}
列表 ul、ol
在开始处理之前，先介绍一个插入 DOM 的 API insertAdjacentElement。
在 vue、react 这些框架的盛行，基本上我们已经不会再用到 DOM 操作，不过可以了解一下，万一以后用得到呢。
// 将给定元素element插入到调用的元素的某个位置
element.insertAdjacentElement(position, element)
参数position可以是以下位置
'beforebegin': 插入元素之前，类似 insertBefore'afterbegin': 插入元素第一个 children 之前，类似 prepend'beforeend': 插入元素最后一个 children 之后，类似 appendChild'afterend': 插入元素之后，类似 insertAfter
接着我们看一下列表这部分的修改，由于我们项目功能上的需求，列表是使用 div 标签来改造的，所以需要将 div 标签转为 ul/ol，下面是我的实现
const changeDiv2Ul = (div: HTMLElement | Element, parent?: HTMLElement | Element) => {
const kind = div.getAttribute('data-list-kind')
const ul = kind === 'ordered' ? document.createElement('ol') : document.createElement('ul')
const li = document.createElement('li')
// 去除margin 不然在word中会偏移
!parent && (ul.style.margin = '0')
li.innerHTML = div.innerHTML
ul.appendChild(li)
parent ? parent.insertAdjacentElement('afterend', ul) : div.insertAdjacentElement('afterend', ul)
div.parentElement?.removeChild(div)
li.querySelectorAll('.list-marker').forEach((marker) => marker.parentElement?.removeChild(marker))
// 内容区域
li.querySelectorAll('.list-content').forEach((content) => {
const span = document.createElement('span')
span.innerHTML = (content.firstChild as HTMLElement).innerHTML
content.insertAdjacentElement('beforebegin', span)
if (content.querySelectorAll('.prosemirror-flat-list').length) {
content.querySelectorAll('.prosemirror-flat-list').forEach((div) => changeDiv2Ul(div, content))
}
content.parentElement?.removeChild(content)
})
}
cloneEle.querySelectorAll('.prosemirror-flat-list').forEach((div) => changeDiv2Ul(div))
复选框 checkbox
复选框 checkbox 的处理，首先考虑的是转为来处理，结果转完后并没有显示复选框；
接着又想着用 span 标签生成一个方框，，这样总能显示了吧！结果依然不行。
正当我想不到办法的时候，突然灵机一动，可不可以把 word 转成 html 后看看 checkbox 最终会显示成啥样呢？
于是通过在线 word 转 html将 word 转为 html 后，看到复选框对应的 html 内容为，改一下吧。
const span = document.createElement('span')
span.innerHTML = ``
marker.insertAdjacentElement('beforebegin', span)
marker.parentElement?.removeChild(marker)
转成 word 后，复选框的选中和取消功能也能正常使用。
附件导出、多维表等 iframe 内容
参考了一下钉钉文档
这样就很好改了，只需要把附件对应的节点内容，改为链接即可。
cloneEle.querySelectorAll('.attachment-node-wrap').forEach((attach) => {
const title = `请至One文档查看附件《${attach.getAttribute('name')}》`
const anchorId = attach.parentElement?.getAttribute('data-id')
const a = document.createElement('a')
a.target = '_blank'
a.href = `${location.href}&anchor=${anchorId}`
a.innerHTML = `${title}`
attach.insertAdjacentElement('beforebegin', a)
attach.parentElement?.removeChild(attach)
})
未解决的部分
表情无法导出，这个我看了下其他在线协作文档，也有同样的问题。
小结
其实，处理这些问题的方式也是很简单，因为html-docs-js是用html字符串来作为导出文档的输入。如果导出后发现样式不对的情况时，我们只需要去修改html内容即可。
如果有遇到像复选框checkbox这类不知道怎么解决的问题，也可以采用反推，先通过word转html，然后看转为html后的内容，再去修改需要导出的html内容，这也不失为一种解决问题的方式。
以上是我在使用html-docs-js插件时遇到的一些问题及处理方式，如果有遇到同样问题的小伙伴，可以说下你们的处理方式。或者这里没有提到的问题，也欢迎大家补充。
本文转载于:
https://juejin.cn/post/7220244579671916604
如果对您有所帮助，欢迎您点个关注，我会定时更新技术文档，大家一起讨论学习，一起进步。

精彩内容
评论可见，请评论后查看内容，谢谢！！！评论后请刷新页面。

本文由用户于 2024-05-14 发布在夸智网，如有疑问，请联系我们。
本文链接：https://www.kuazhi.com/post/714001086.html

0赞

上一篇
vue.js javascript ecmascript vue中实现倒计时功能

下一篇
javascript 开发语言 ecmascript huggingface大模型载入

相关文章

vue.js 前端 javascript Vue中的.env文件：配置、用法和注意事项

【Docker学习笔记】Docker技术总结，成功拿下大厂offer

nacos初探--作为配置中心

docker安装 docker架构 docker生态 Docker学习——②

数据库 MongoDB可视化工具Robo 3T的下载、安装与使用介绍

spring cloud SpringCloud系列（7）--Eureka服务端的安装与配置

kubernetes linux CentOS 7.9 安装 k8s(详细教程)

云原生架构 Eureka上集成Spring Cloud 微服务网关 gateway

发表评论取消回复

0赞 微信新浪微博QQ空间QQ

TA的新帖
数据库如何解决Windows版64位SQLite，sqlite3安装
2024-06-14
notepad++ uni-app uniapp pages.json 页面路由
2024-06-14
【优质书籍推荐】Node.js+MongoDB+Vue.js全栈开发实战
2024-06-14
oracle spring boot ORA-00257: Archiver error. Connect AS SYSDBA only until resolved错误解决
2024-06-14
力扣 python 代码随想录算法训练营第二十七天|贪心算法理论基础，455.分发饼干，376. 摆动序列，53. 最大子序和
2024-06-14
时光邮局慢递一封信
2024-06-13
热门文章
EducUp Studio
2024-06-13
Watermark Remover by Magic Studio
2024-06-13
Spiritme AI ScriptWriter
2024-06-13
Broadn
2024-06-13
VWO
2024-06-13
Aispect
2024-06-13
ExtendMusic.AI
2024-06-13
ExplainThis AI
2024-06-13
Coqui
2024-06-13
HiPDF-免费PDF在线编辑工具_PDF转Word_PDF在线转换
2024-06-13
Ferret AI
2024-06-13
演界网官网 - 精美PPT模板会员免费下载,矢量图片素材多品类模板服务平台
2024-06-14
ChatGPT Data & Analytics
2024-06-13
Thekeys
2024-06-13
typly
2024-06-13
AskMyDocs.ai
2024-06-13
Pika
2024-06-13
Usetwain
2024-06-14
pdflux
2024-06-13
Resemble
2024-06-13
Artius
2024-06-13
Neural Canvas
2024-06-13
ParagraphAI
2024-06-13
Browse AI
2024-06-13
AI Content Detector
2024-06-13
Article Audio
2024-06-13
Getimg.ai
2024-06-14
数字鸭AI助手
2024-06-13
Elephas
2024-06-13
TinyWow
2024-06-13
热评文章
柚子快报赚钱软件下载778899分享：UE4逆向篇-1
2024-06-13
人工智能 8个免费使用ChatGPT网站，部分可使用gpt4
2024-06-14
spring java spring boot swagger在项目中的使用，快速上手。
2024-06-13
android 开发语言 visual studio code 前端【PHP【实战项目】系统性教学】——使用最精简的代码完成用户的登录与退出
2024-06-14
算法华为机试 JavaScript C语言华为OD机试 - 推荐多样性（Java & JS & Python & C & C++）
2024-06-14
算法华为机试 JavaScript C语言华为OD机试 - 学生重新排队（Java & JS & Python & C & C++）
2024-06-14
驱动开发音视频视频编解码 h.264 h.265 FFmpeg 在Windows环境下 Intel ，Nvidia ，AMD 硬件加速编解码支持列表
2024-06-13
华为机试华为机考 2024华为OD机试真题【区间交叠/贪心算法】【 Java 】
2024-06-14
软件测试软件测试工程师负载测试自动化测试 Jmeter性能测试【性能测试】稳定性/并发压力测试的TPS计算+5W并发场景设计...
2024-06-14
kotlin 开发语言 Android动态更换图标
2024-06-14
javascript 前端 Typescript 之接口 interface（详解）
2024-06-14
colab读取google drive的文件
2024-06-13
ubuntu 驱动更新后导致无法进入界面
2024-06-14
python selenium 自动化天津大学成绩/通知查询脚本
2024-06-14
typescript yarn vue3代码规范
2024-06-14
机器学习逻辑回归人工智能 MindSpore:损失函数nn.SoftmaxCrossEntropyWithLogits 解析
2024-06-14
vscode cmake .net开发实践: C#如何调用C/C++库
2024-06-14
c++ visualstudio 计算机视觉浅谈OpenCV——filter2D根据代码讲原理
2024-06-14
数据分析 nosql redis Reids常用操作
2024-06-14
PostgreSQL和PostGIS安装以及如何连接到ArcGIS pro
2024-06-14
云原生黄东旭：开发者的“技术无感化”时代，从 Serverless HTAP 数据库开始 | PingCAP DevCon 2022
2024-06-14
java tomcat eclipse 【系统分析与设计】高校学生社团管理系统
2024-06-13
柚子快报邀请码有没关系的778899分享：解决win10卡的问题
2024-06-14
java~springcloud微服务目录索引
2024-06-14
linux查看日志文件tail -f用法 -九五小庞
2024-06-14
Linux Namespace : PID
2024-06-14
visualstudio c语言 c++ Visual Studio 2022最新版安装教程(数千字图文详解)，一步步教会你如何安装并运行VS2022(+背景图设置)
2024-06-13
网络电脑文件夹怎么加密？文件夹加密方法介绍
2024-06-14
网络安全 web安全网络攻击模型安全威胁分析安全架构可信计算技术内网安全--小结
2024-06-14
柚子快报激活码多少778899分享：xamarin之安装工具介绍
2024-06-14
最新评论
以上内容提到了如何通过ChatGPT来推荐适合自己阅读的科幻小说清单，并提供了Python和Node.js接口请求示例以及curl命令示例，还介绍了如何下载相关资料进行学习。这些示例代码中使用的API密钥需要从环境变量中获取，而在实际应用中，应该将API密钥存储在安全的地方，以避免泄露风险，对于curl命令示例中的OPENAI_API_KEY变量，也需要确保该变量已经正确设置。除此之外，以上内容没有明确指出所使用的ChatGPT模型的具体版本号和参数设置，因此可能会导致生成的列表结果不够准确或符合预期，在使用ChatGPT进行文本生成时，建议根据具体需求调整模型参数，并根据实际情况进行测试和优化。
2024-06-14
在Python中，TypeError: 'str' object is not callable 错误通常是由于尝试调用一个不可调用的对象导致的，这个问题的解决方法是重命名变量，避免与Python的底层函数(如str())冲突。如果我们有以下代码：```pythonstr = helloresult = str()```这里，我们将一个字符串赋值给了变量str,然后试图将其作为函数调用，这就是为什么会出现TypeError: 'str' object is not callable错误的原因。为了解决这个问题，我们需要将变量名str更改为其他名称，以避免与内置函数冲突，在这个例子中，我们可以将变量名更改为str_value:```pythonstr_value = helloresult = str_value()```这样就不会出现TypeError: 'str' object is not callable错误了，为了避免这种错误，我们在定义变量时应尽量选择独特的名称，不要与Python的内置函数冲突。
2024-06-14
手机登录chatGPT的实现相对简单，只需要下载相应的应用，注册并登录账号，然后进行个人设置，就可以随时随地与chatGPT进行交流，需要注意的是，chatGPT仍然是一种人工智能技术，受限于算法和数据的局限性，可能在复杂的情境下无法正确理解用户的问题，或者给出准确的答案，在使用手机登陆chatGPT时，我们要保持科学理性的态度，同时提高对其回答的辨别能力。
2024-06-14
在本文中，作者介绍了chatgpt谷歌账号、淘宝chatgpt账号、chatgpt国外账号和chatgpt购买账号的功能和优势，这些账号为用户提供了智能化的对话助手服务，帮助用户解决各种问题，提高生活质量和工作效率。文章存在一些问题：1. 文章内容较为简短，没有对每个账号的具体功能和优势进行详细阐述，建议作者可以针对每个账号进行更详细的介绍，以便读者更好地了解和使用这些账号。2. 文章中提到了chatgpt作为一款基于大规模模型的自然语言处理工具，但没有对其技术原理和实现进行解释，建议作者可以简要介绍一下chatgpt的技术原理，以便读者更好地理解其工作原理和功能。3. 文章中提到了人工智能技术的不断发展，但没有对未来发展趋势和可能带来的影响进行分析，建议作者可以结合当前的技术发展状况，对未来人工智能技术的发展趋势和可能带来的影响进行预测和分析。4. 文章中存在一些表述不够准确的地方，这使得chatgpt不仅仅是一个智能对话助手，更是一个能够根据用户需求灵活应变的多功能工具。”建议作者在修改时对这些表述进行斟酌和优化，以确保表述的准确性和通顺性。
2024-06-14
chatGPT作为一种基于人工智能技术的聊天机器人，可以为用户提供心理咨询服务，它具有高度便捷、保护个人隐私等优势，但在处理复杂心理问题和真实的情感支持方面存在局限性，在使用chatGPT进行心理咨询时，用户需谨慎选择适当的方式与专业的心理咨询师进行交流，以获得更准确和有效的帮助。
2024-06-14
以上内容没有明显的问题，但可以对一些表述进行优化，可以将桥接模式是很好理解的改为桥接模式的理解相对简单，将相信认真看了实例的同学应该都可以看懂改为如果认真学习了实例，大部分同学应该都能理解，在提到设计模式时，可以简要介绍一下各种设计模式的特点和应用场景，以帮助读者更好地理解和选择合适的设计模式。
2024-06-14