Database 在SEC网站上找不到引用的R文件?

Database 在SEC网站上找不到引用的R文件?,database,dataframe,sec,Database,Dataframe,Sec,我试图理解此处找到的2020q1数据集:, 我使用2020q1文件夹中的参考文档作为“自述”文件。参考文件规定: 在Presentation pre数据集中,“report”字段是一个数字整数,其“值”表示发布的“R文件” 在EDGAR网站上,“经过广泛的搜索,我没有找到这样的文件,也没有办法解释这份报告” 字段和所有相关数据。如果可能的话,请链接到适当的R文件,或引导我向正确的方向寻求帮助。谢谢 前面有一点需要澄清,因为这也让我感到困惑,所讨论的R文件不是的脚本文件。相反,它似乎只是一个保存格

我试图理解此处找到的2020q1数据集:, 我使用2020q1文件夹中的参考文档作为“自述”文件。参考文件规定: 在Presentation pre数据集中,“report”字段是一个数字整数,其“值”表示发布的“R文件” 在EDGAR网站上,“经过广泛的搜索,我没有找到这样的文件,也没有办法解释这份报告”
字段和所有相关数据。如果可能的话,请链接到适当的R文件,或引导我向正确的方向寻求帮助。谢谢

前面有一点需要澄清,因为这也让我感到困惑,所讨论的R文件不是的脚本文件。相反,它似乎只是一个保存格式化数据的报告文件

因此,在深入阅读自述文件之后,我在SUB.txt数据的描述中发现了以下细节

注:要访问给定文件的完整提交文件,请访问SEC EDGAR网站。SEC网站文件夹HTTPs://www.SEC.gov/Archives/edgar/data/{cik}/{accession}/将始终包含给定提交的所有数据集。要将文件夹地址组合到子数据集中引用的任何文件,只需用cik字段替换{cik},并在删除破折号字符后用adsh字段替换{ACCESS}。以下示例SQL查询提供了如何为子数据集中包含的文件生成地址列表的示例:

·选择名称、表格、句点、'https://www.sec.gov/Archives/edgar/data/“+LTRIMSTRICK,10+'/'+replaceadsh'-',+'/'+实例作为url从SUBM按句点描述的SUBM顺序排列,名称

因此,看起来我们必须将每个adsh提交ID与cik公司ID关联起来,以获得我们正在寻找的链接

对pre.txt的第一个条目执行此操作,我们得到的adsh值为0001032208-20-000006。我只是用记事本搜索sub.txt,找到了它的相关cik 1032208,它属于SEMPRA ENERGY。因此,我们生成以下链接:

从那里,我们找到与给定提交相关联的文件目录。里面是一个前缀为R的文件集合。只需单击这些文件,即可在浏览器中使用“报告”和“行”字段打开它们,然后我们就可以关联所需的文件。请注意,我们可以在生成的链接末尾添加/R{number}.htm以查找此文件夹,从而获得给定的报告编号


如果您知道自己在寻找什么,那么使用ctr+f find功能手动执行此操作应该可以。否则,您可能需要在excel中打开这些文档以生成链接。

非常感谢。