提取主URL地址_R_Url_Stringr - Fatal编程技术网

提取主URL地址

r url

提取主URL地址,r,url,stringr,R,Url,Stringr,我有一个URL列表，我想提取主URL以查看每个URL被使用了多少次。正如您所想象的，有这么多的URL使用不同的符号。我尝试并编写了以下代码来提取主URL： library(stringr) library(rebus) # Step 2: creating a pattern for URL extraction pat<- "//" %R% capture(one_or_more(char_class(WRD,DOT))) #step 3: Creating a

我有一个URL列表，我想提取主URL以查看每个URL被使用了多少次。正如您所想象的，有这么多的URL使用不同的符号。我尝试并编写了以下代码来提取主URL：

library(stringr)
library(rebus)

# Step 2: creating a pattern for URL extraction
pat<- "//" %R% capture(one_or_more(char_class(WRD,DOT)))

#step 3: Creating a new variable from URL column of df
#(it should be atomic vector)
URL_var<-df[["URLs"]]  

#step 4: using rebus to extract main URL
URL_extract<-str_match(URL_var,pattern = pat)

#step 5: changing large vector to dataframe and changing column name:
URL_data<-data.frame(URL_extract[,2])
names(URL_data)[names(URL_data) == "URL_extract...2."] <- "Main_URL"

库（stringr）
图书馆（REBS）
#步骤2：创建URL提取模式
帕特我想你可以简单地使用
库（stringr）
URL\u varTry没有rebus
，只是URL\u数据我使用rebus的原因是我更容易理解它。关于您的代码，不幸的是，此解决方案不起作用。原因是，在最后，我想对同一个URL进行分组，看看与其他URL相比，哪个主URL使用得更多。根据您提到的代码，结果如下：www.google.com/235 www.google.com/465；然而，我关心的只是www.google.com…好的，那么使用”（？太好了，这会更好。你能详细说明一下你使用的语法并告诉我它的意思吗？
(?<=//)[^\s/:]+




[url]相关文章推荐



                                                        
magento类别URL
urlmagento 
在Windows Phone上，如果URL本身已知，我可以查看URL的来源吗？
urlwindows-phone-7 
动态Url重写附加问题
url 
Url 在mvccontrib网格中自定义td内部html
urlgrid 
SpringMVC中的方法处理-相同url路径
urlspring-mvcpath 
youtube如何在URL中编码视频ID？
urlyoutube 
Url 如何为我的网站设置自定义域前缀'；s网址
urlwebdns 
struts2。将路径添加到url
urlstruts2 
如何在url中没有id的情况下执行数据库查询？
urlweb 
Url 不带get的JavaScript位置
url 
Angurlarjs获得外部服务
urlserviceangularjs 
我想生成搜索引擎友好的URL
urlmod-rewrite 
Laravel重定向：：不更改url
urlredirectlaravel-4 
AngularJs路由| don'；不要更改URL
urlredirect 
如何处理Vaadin7中的可书签URL？
urlvaadin 
Url 在经典asp中从查询字符串中获取特殊字符
urlasp-classic 
如何取消浏览url'；主持人是谁？
urlgo 
如何使用Firebase将URL重写到另一个文件夹？
urlwebfirebaseurl-rewriting 
使用jxbrowser在同一浏览器中加载多个URL
url 
Notes客户端中的Xpages context.getUrl（）忽略反斜杠/&引用；
urlxpages 
                                       





随机文章推荐



                                                        
Memory 内存INI文件编写器
memorymfcsecurity 
OutOfMemoryException处理大文件
memorymapbiztalk 
Memory 渲染上下文/内存问题
memorymemory-management 
Memory 在什么情况下，内存是字节或字可寻址的，为什么
memory 
Memory 调用MPI_Init（）后内存会发生什么变化？
memorympi 
Memory 将操作码插入内存
memoryassemblylispcommon-lisp 
Memory 使用IA-32汇编语言时变量的内存位置
memoryassemblyx86 
Memory 将参数中的字符串添加到共享内存
memory 
Memory 对fgetcsv（）的单次调用会耗尽PHP中的大内存限制
memorynginxphp 
Memory malloc在细节上是如何工作的？
memory 
Memory 不可获胜页面的特定内容是什么？
memorymemory-managementlinux-kernelfilesystemskernel 
Memory cuda memcheck输出的函数名跟踪
memorycuda 
在Java中，内存泄漏是否只能导致OutOfMemoryError？
memorymemory-leaksjava-8 
Memory 新流程驻留在哪里？在主内存还是辅助内存中？
memorymemory-managementprocessoperating-system 
Memory x86保护模式内存管理
memorymemory-managementx86 
Memory UEFI引导内核：静态物理内存布局
memory 
Memory 在运行时不包含垃圾收集器的情况下，垃圾收集语言能否编译为非垃圾收集语言？
memorycompiler-construction 
Memory 我可以将页表的位置更改为另一个NUMA节点吗？
memoryoperating-systemkernel 
Memory 如何在内存数据库中调整TimesTen所需的内存大小？
memory 
Memory 使用newlib nano malloc时，sbrk的增量值来自哪里？
memoryembeddedstm32


                                        

                                        
                                        


                                                
                                                        [r]相关推荐
                                                        
如何使用2个条件从data.frame中选择行
									R
							 
R 在空白处拆分字符串向量
									R
							 									String
							 									Vector
							 
什么是Matlab的R等价物'；什么是fminunc函数？
									R
							 									Matlab
							 									Math
							 
是否有一种简单的方法可以复制已安装的CRAN软件包列表（具有确切的版本）？
									R
							 
在lappy中使用deparse（替代品（x））？
									R
							 
R 使用SSL的NGINX上的闪亮服务器
									R
							 									Ubuntu
							 									Ssl
							 									Nginx
							 
如何通过tf idf为R中的每个文档生成顶部单词？
									R
							 									Text
							 
R 如何获取目标中随机生成器当前状态的种子，以将其放入set.seed（）函数中
									R
							 									Random
							 
在R中重新估价，但有违约
									R
							 									Regex
							 
R 设置alpha并删除GG对密度图的黑色轮廓
									R
							 
使用R/knitr自动生成乳胶束载玻片
									R
							 									Latex
							 
检查特定时间是否在R的范围内
									R
							 
如何使用mxnet包为R中的前馈神经网络指定正则化参数（L1或L2）？
									R
							 									Neural Network
							 									Deep Learning
							 
R数据表-将分组列添加到选定数据中
									R
							 
R 在将数据帧转换为xts进行时间序列分析时，我做错了什么？
									R
							 									Date
							 									Dataframe
							 
R 动态列选择
									R
							 									Dynamic
							 
带有plotly的R中散点图旁边的箱线图
									R
							 
R 绘图仪改变雷达图的字体大小
									R
							 									Plot
							 
更新R中的DT列筛选器选项
									R
							 									Shiny
							 									Datatables
							 
选择R中数据表的每一列。两个语法之间的区别是什么
									R
							 
使用stringr库缩写R中的名称向量
									R
							 
以LaTeX格式呈现反应性stargazer表
									R
							 									Shiny
							 
R 在数据帧子集上重叠而不进一步拆分
									R
							 									List
							 									Dataframe
							 
图例混合形状与几何点R
									R
							 
r：将自定义函数中创建的列表中的n个数据帧子集分配给全局环境中的对象
									R
							 									List
							 									Function
							 									Dataframe
							 
对于RcppAlgos（R），是否有一个函数来获取结果组合中元素的索引？
									R
							 
R 每个变量的唯一真/假计数
									R
							 									String
							 
R-基于两个元素平均值的顺序/排序嵌套列表
									R
							 									List
							 
R 如何创建显示低/高价格的ggmap热图？
									R
							 
在R中是否有一种简单的方法将列表转换为列数据帧？
									R
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Windows 10
Modelica
Ibm Mobilefirst
Openssl
Sockets
Cocoa Touch
Debian
Firebase
Gmail
Xampp
Orm
Sharepoint 2010
Logstash
Http
Oracle Apex
Botframework
Azure
Windows Store Apps
Git
Internationalization
Sap
Gwt
Apache Zookeeper
Parallel Processing
Network Programming
Spring
Codenameone
Xamarin.android
Angular6
Time Complexity
Tinymce
Xpages
Linker
Web
F#
Wcf
Google Cloud Storage
Validation
Osgi
Omnet++
Templates
Salesforce
Jenkins
Haskell
Nsis
Clang
Log4j
Bazel
Ruby
Syntax
Neural Network
Windows
Google Cloud Firestore
Oracle
Ssas
Keras
Jestjs
Hyperledger Fabric
Xamarin
Visual C++
Mvvm
Tridion
Typo3
Powerbi
Amazon Redshift
Cluster Computing
Twilio
Drop Down Menu
Vb.net
Android Fragments
Listview
Performance
Wordpress
Zend Framework2
Zend Framework
Websocket
Netty
Solr
X86
Optimization
Virtualbox
Google Cloud Dataflow
Random
Printing
Uitableview
Smtp
Azure Sql Database
Email
C
Raspberry Pi
Crystal Reports
Menu
Pointers
Sorting
Silverstripe
Frameworks
Svn
Swift3
Inno Setup
Antlr4
Algorithm
Enums
Udp
Error Handling
Matrix
Exception Handling
Pascal
Sql Server
Plugins
Compression
Autodesk Forge
Design Patterns
Jekyll
Matlab
Kubernetes
Operating System
Quickbooks
Fonts
Streaming
.htaccess
Sed
Visual Studio 2008
Sharepoint 2013
Linux
Browser
Typescript
Leaflet
Redis
Memory
Sml
Internet Explorer 8
Google App Engine
Woocommerce
Telerik
Prestashop
Sas
Sapui5
Methods
String
Symfony1
Elixir
Path
Jhipster
Gps
Xml
Import
Ethereum
React Native
Yii2
Asp.net Core Mvc
Graphql
Geolocation
Laravel 4
Video
Certificate
Audio
Julia
Migration
Jersey
Asterisk
Android
Nest
Processing
Servlets
Binding
Bots
Plsql
Netlogo
Fluent Nhibernate
Intellij Idea
Anaconda
Reflection
Encoding
Layout
Mono
Opencart
Cuda
Logic
Gis
Sdk
Ag Grid
Mpi
Xcode4
Compiler Errors
Extjs
Wxpython
Apache Flink
Routes
Calendar
Npm
Video Streaming
Ant
Apache2
Ubuntu
Loopbackjs
Corda
Grid
Cron
Delphi
Azure Data Factory
Configuration


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网