使用awk读取模式中的文件_Awk - Fatal编程技术网

使用awk读取模式中的文件

awk

使用awk读取模式中的文件,awk,Awk,我有一个如下方式的输入文件 <td> Name1 </td> <td> <span class="test"><a href="url1">Link </a></span></td> <td> Name2 </td> <td> <span class="test"><a href="url2">Link </a></span

我有一个如下方式的输入文件

<td> Name1 </td>
<td> <span class="test"><a href="url1">Link </a></span></td>
<td> Name2 </td>
<td> <span class="test"><a href="url2">Link </a></span></td>

url1 Name1
url2 Name2

有人能帮我解决这个看起来微不足道的问题吗？谢谢。

每个提取一个href相对简单，只要它们符合XHTML标准，并且一行最多只有一个href，并且您不关心是否包含标签，但perl更容易：

$ perl -ne 'print "$1\n" if /href="([^"]+)"/'

如果您关心封闭标记，或者它们不是标准的一致性标记，那么就不能使用正则表达式来解析HTML。这是不可能的

添加：oops，您确实关心上下文，忘记regexp，使用真正的HTML解析器

awk '
/a href=\".*\"/ { sub( /^.*a href=\"/,"" ); sub(/\".*/,"");  print $0, name }
                { name = $2 }
'

这可能会奏效：

awk 'BEGIN
     {i=1}{line[i++]=$0}
     END
     {
      j=1; 
      while (j<i) 
      {print line[j+1] line[j]; j+=2}
     }' yourfile|awk '{print substr($4,7,length($4)-6),$6}'

awk'开始
{i=1}{line[i++]=$0}
结束
{
j=1；
而（jgawk'/^/{n=$2；getline；print gensub（/.*href=“（[^”]*）.*/，“\\1”，1），n}
url1名称1
url2名称2
awk'BEGIN{RS=“>\n”；FS=“>|您的easy perl脚本无法将其切掉；-）。通过给定的输入，它将输出行“url1”和“url2”。+1，用于指出需要真正的解析器（并使用术语准同步）。
gawk '/^<td>/ {n = $2; getline; print gensub(/.*href="([^"]*).*/,"\\1",1), n}' infile

url1 Name1
url2 Name2




[nlp]相关文章推荐



                                                        
Nlp 使用“a”是否更好；“天然的”；用什么语言编写代码？
nlp 
Nlp 词干化和去模糊化的区别
nlp 
Nlp 最佳自动文档分类库
nlp 
Nlp 如何在matlab中使用Wordnet定位文本文件？
nlpmatlab 
Nlp 一对词的词义消歧
nlpartificial-intelligence 
Nlp 文本摘要：如何选择正确的n克大小
nlp 
Nlp 自定义字标记器
nlp 
Nlp 在文本中执行语义分析
nlp 
Nlp 使用NLTK中的自定义标记对标记器进行培训
nlp 
Nlp 如何使用wit.ai为fb聊天机器人编写中间逻辑？
nlp 
Nlp 关于英语模式中括号的解析
nlp 
Nlp 排序关键字识别的度量
nlp 
Nlp 在tensor2tensor中运行示例项目
nlp 
Nlp 如何预处理文本以匹配谷歌预先培训的word2vec模型？
nlp 
Nlp spaCy如何为短语生成向量？
nlp 
Nlp 为没有书面形式的语言对齐平行句子
nlp 
Nlp fastText的输入格式是什么？为什么我的模型不'；你不能给我一个有意义的类似输出吗？
nlp 
Nlp 有'；我们在二元释义检测标记任务上有什么联系？
nlp 
Nlp Tensorflow和Bert他们到底是什么和什么'；他们之间有什么区别？
nlp 
是否有一个NLP工具可以在英语中查找相似的意义词？
nlp 
                                       





随机文章推荐



                                                        
C++ cli C++；Ref类不是System:：IDisposable的成员；无法实现IDisposable
c++-cli 
C++ cli 调用C+时的访问冲突+-来自C++/CLI
c++-cli 
C++ cli visualc中的流问题+；2010关于字符串
我试图在Visual C++ 2010中创建Windows窗体应用程序。我在字符串变量“stat”中保存了一些特定字符串，如：
c++-cli 
C++ cli 如何比较拆分前的值？
c++-cli 
C++ cli 在dropbox API中指定搜索查询
c++-cli 
C++ cli 将BoostTest与C++/CLI：可能还是不可能？
c++-cli 
C++ cli visualc&x2B+；GetCurrentDirectory（）在启动过程中工作不正常
c++-cli 
C++ cli 如何将system:：string从组合框更改为字符
c++-cli 
C++ cli 是否可以使用C/C++；可以使用C+将程序编译到.NET可移植类库中+/CLI
我已经阅读了C++中的.NET编程，并且在高层次上理解它可以编译C或C++到.NET MSIL。我还了解到，在这个过程中会翻译本机结构
c++-cli 
C++ cli 属性与类型同名-我可以去掉显式命名空间吗？
c++-cli


                                        

                                        
                                        


                                                
                                                        [awk]相关推荐
                                                        
给定范围的awk打印列
									Awk
							 
awk-打印一个字段n个字段，远离匹配字段
									Awk
							 
使用awk从文件中提取段
									Awk
							 
fortran输出的Awk
									Awk
							 									Fortran
							 
使用awk和/或sed命令扩充路径
									Awk
							 									Sed
							 
使用sed或awk仅在第一个delimeter之前替换一行中的单词
									Awk
							 									Sed
							 
Awk 查找具有特定条件的行的编号（使用下一行）
									Awk
							 
Awk 删除文件中某行上方的重复条目
									Awk
							 									Sed
							 									Grep
							 
使用awk命令获取正确的名称
									Awk
							 
Awk 对命令列表重新排序并重新编号
									Awk
							 
Awk 按块名合并两个ini文件
									Awk
							 
Awk sed第二个管道符号前面的所有内容
									Awk
							 									Sed
							 
Awk 将该栏汇总并放在该栏旁边
									Awk
							 
Awk 两个LinuxBash案例
									Awk
							 
awk将多个空间缩小为一个
									Awk
							 									Perl
							 
Awk 比较两个文件并打印匹配的字符串，上面一行，下面一行
									Awk
							 									Grep
							 
Awk sed与其他文件内容内联
									Awk
							 									Sed
							 
在字段中循环并在awk中打印上一行
									Awk
							 
根据第一列的字符将行分发到文件（使用awk）
									Awk
							 
Awk 如何计算每列的平均值和单独文件中的数据？
									Awk
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Julia
Opengl
Visual Studio 2017
Dialogflow Es
Vim
Passwords
Arduino
Fiware
Phpstorm
Backbone.js
Safari
Wolfram Mathematica
Numpy
Directory
Seo
Jasper Reports
Calendar
Graph
Spring Batch
Dynamic
Couchdb
Salesforce
Kotlin
Permissions
Unit Testing
Mongoose
Aframe
Localization
Three.js
Replace
Hash
Function
Flask
Winforms
Moodle
Asp.net Mvc 5
Domain Driven Design
Angularjs
Architecture
Doctrine Orm
Data Structures
Module
Talend
Xpages
Security
Debugging
Stata
Cygwin
Documentation
Nuget
Sip
Iis 7
Plone
Actionscript
Time
Php
Laravel 4
Filter
Stm32
Asp.net Web Api
Cloud Foundry
Requirejs
Ldap
Testng
C++11
Ibm Mobilefirst
Ionic Framework
Sugarcrm
Awk
Octave
Ckeditor
Machine Learning
Qt4
Robotframework
Maps
R
Drupal
Clojure
Linq To Sql
View
.net 4.0
Websphere
Triggers
Arrays
Jboss
Virtual Machine
Yocto
Sharepoint
Windows Phone
Inno Setup
Keycloak
Video Streaming
Lua
C#
Cocos2d X
Camera
Amazon Web Services
Amazon Cloudformation
Ffmpeg
Python 2.7
Telegram
Centos
Oracle10g
Datatables
Sencha Touch 2
Itext
Model
Cordova
Grafana
Z3
Maven 2
Networking
Plugins
Charts
Checkbox
Ide
Processing
Hybris
Ssis
Asterisk
Xamarin.forms
Drop Down Menu
Canvas
Scroll
Oauth 2.0
Sas
Vaadin
Nestjs
Racket
Elm
Symfony1
Openlayers
Sql Server 2005
Download
Coq
Streaming
Asp.net Core
Jupyter Notebook
Node.js
Enums
Sequelize.js
Validation
Spotify
Twitter
Editor
Msbuild
Wpf
Hyperlink
Cobol
Biztalk
Jsf 2
Youtube Api
Netsuite
Interface
Bootstrap 4
Asp.net Core Mvc
Twilio
Arangodb
Cmd
Sitecore
Azure Data Factory
Asp Classic
Kdb
Openssl
Glassfish
Parameters
Forms
Internet Explorer
Windows Phone 8.1
Google Plus
Windows Phone 8
Join
Amazon Redshift
Shiny
Testing
Gps
Build
Winapi
Javafx 2
Ruby On Rails 3.2
Azure Active Directory
Ios5
Cocos2d Iphone
Loops
C
Docker
Command Line
Tabs
Pascal
Macos
Monitoring
Cron
Firefox Addon
Pentaho
Css
Filesystems
Rxjs
Iframe
Amp Html
Apache Storm
Amazon Dynamodb


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网