C# 如何判断PDF文本是否已旋转
我正在尝试使用iText7从PDF中提取文本。我使用IEventListener获取页面的所有部分,尽管部分文本是旋转的。我可以找到如何将旋转文本插入PDF的示例,但找不到任何关于如何判断给定文本段是否旋转的示例 有人能帮忙吗C# 如何判断PDF文本是否已旋转,c#,text,rotation,itext7,C#,Text,Rotation,Itext7,我正在尝试使用iText7从PDF中提取文本。我使用IEventListener获取页面的所有部分,尽管部分文本是旋转的。我可以找到如何将旋转文本插入PDF的示例,但找不到任何关于如何判断给定文本段是否旋转的示例 有人能帮忙吗 public void EventOccurred(IEventData data, EventType type) { PdfPart part = null; switch (type) { case EventType.BE
public void EventOccurred(IEventData data, EventType type)
{
PdfPart part = null;
switch (type)
{
case EventType.BEGIN_TEXT:
break;
case EventType.RENDER_TEXT:
part = new PdfTextPart(PageNumber, data as TextRenderInfo);
Parts.Add(part);
break;
case EventType.END_TEXT:
break;
case EventType.RENDER_IMAGE:
var imageData = data as ImageRenderInfo;
//this.HandleImage(imageData);
break;
case EventType.RENDER_PATH:
part = new PdfLinePart(PageNumber, data as PathRenderInfo);
Parts.Add(part);
break;
case EventType.CLIP_PATH_CHANGED:
break;
default:
break;
}
}
TextRenderInfo
有一条基线。此基线是一个线段
,因此有一个起点和一个终点。现在你只需要确定这两点之间的线的角度
例如,对于文本渲染信息:
LineSegment baseline = info.GetBaseline();
Vector startPoint = baseline.GetStartPoint();
Vector endPoint = baseline.GetEndPoint();
Vector direction = endLocation.Subtract(startLocation);
double angle = Math.Atan2(direction.Get(Vector.I2), direction.Get(Vector.I1));
结果显然是弧度测量
您可能还需要考虑页面旋转(如果我没记错的话),而页面旋转没有计算到上面的坐标中。非常好的答案,非常有效。我正在处理几千份政府制作的文档,所以我不必担心页面轮换(幸运的是:)
LineSegment baseline = info.GetBaseline();
Vector startPoint = baseline.GetStartPoint();
Vector endPoint = baseline.GetEndPoint();
Vector direction = endLocation.Subtract(startLocation);
double angle = Math.Atan2(direction.Get(Vector.I2), direction.Get(Vector.I1));