网站首页 > 技术文章 正文
前几天,我手里的一个项目需要将富文本的所有 html 标签全部删除,得到纯文本后再存储到数据库中。在一系列得搜索操作之后,我找到了实现这个目的的几种方法,在这里我分享给大家,当你遇到同样的情况兴许也能用的上。
1. 使用 .replace(/<[^>]*>/g, '')
这个方法是从文本中去除 html 标签最简单的方法。它使用字符串的方法 .replace(待替换的字符串,替换后的字符串) 将 HTML 标签替换成空值。 /g 是表示替换字符串所有匹配的值,即字符串中所有符合条件的字符都将被替换。
这个方法的缺点是有些 HTML 标签不能被剔除,不过它依然很好用。
2. 创建临时DOM元素并获取其中的文本
这种方法是完成该问题的最有效的方法。创建一个临时 DOM 并给他赋值,然后我们使用 DOM 对象方法提取文本。
3. 使用 html-to-text npm 包
html-to-text 这个包的功能很全了,转换也有许多的选项比如:wordwrap, tags, whitespaceCharacters , formatters 等等。
安装:
npm install html-to-text
使用:
最后感谢阅读,如果此文对您有帮助,请点赞或添加关注。
猜你喜欢
- 2025-09-24 计算机Office快捷键总结_计算机office快捷键大全
- 2025-09-24 办公小技巧:巧用通配符提取所需信息
- 2025-09-24 证件照尺寸及更换背景颜色教程_证件照换尺寸和底色
- 2025-09-24 5G尚未普及6G呼啸而来?关键技术仍在摸索
- 2025-09-24 三菱CNC数控编程G代码详细讲解_三菱数控系统编程代码
- 2024-08-06 Ctrl+H——Word文档中最强大的快捷键,没有之一
- 2024-08-06 gh-ost 原理(ghost原理详解)
- 2024-08-06 移动存储已经今非昔比了(移动存储解决方案)
- 2024-08-06 「JS 逆向百例」无限debugger绕过,某网站互动数据逆向
- 2024-08-06 厉害了!一行代码实现一个简单的模板字符串替换
- 最近发表
- 标签列表
-
- cmd/c (90)
- c++中::是什么意思 (84)
- 标签用于 (71)
- 主键只能有一个吗 (77)
- c#console.writeline不显示 (95)
- pythoncase语句 (88)
- es6includes (74)
- sqlset (76)
- apt-getinstall-y (100)
- node_modules怎么生成 (87)
- chromepost (71)
- flexdirection (73)
- c++int转char (80)
- mysqlany_value (79)
- static函数和普通函数 (84)
- el-date-picker开始日期早于结束日期 (76)
- js判断是否是json字符串 (75)
- c语言min函数头文件 (77)
- asynccallback (87)
- localstorage.removeitem (74)
- vector线程安全吗 (70)
- java (73)
- js数组插入 (83)
- mac安装java (72)
- 无效的列索引 (74)