C++ 阵列中的AVX对准_C++_C_Intrinsics_Avx - Fatal编程技术网

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/6/cplusplus/155.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
C++ 阵列中的AVX对准_C++_C_Intrinsics_Avx - Fatal编程技术网

C++ 阵列中的AVX对准

c++ c

C++ 阵列中的AVX对准,c++,c,intrinsics,avx,C++,C,Intrinsics,Avx,我正在使用MSVC12（Visual Studio 2013 Express），并尝试实现8*8浮点值的快速乘法。问题在于对齐：向量实际上有9*n个值，但我始终只需要前8个，因此，例如，对于n=0，保证32个字节的对齐（当我使用_mm_malloc时），对于n=1，“第一个”值在4*9=36个字节对齐 for(unsigned i = 0; i < n; i++) { float *coeff_set = (float *)_mm_malloc(909 * 100 *sizeof(

我正在使用MSVC12（Visual Studio 2013 Express），并尝试实现8*8浮点值的快速乘法。问题在于对齐：向量实际上有9*n个值，但我始终只需要前8个，因此，例如，对于n=0，保证32个字节的对齐（当我使用_mm_malloc时），对于n=1，“第一个”值在4*9=36个字节对齐

for(unsigned i = 0; i < n; i++) {
    float *coeff_set = (float *)_mm_malloc(909 * 100 *sizeof(float), 32);
    // this works for n=0, not n=1, n=2, ...
    __m256 coefficients = _mm256_load_ps(&coeff_set[9 * i]);
    __m256 result = _mm256_mul_ps(coefficients, coefficients);

    ...
}

for（无符号i=0；i


有没有可能解决这个问题？我想保留我的数据结构，但如果不可能，我会更改它。我找到的一个解决方案是先在对齐的数组中复制8个浮点，然后加载，但性能损失太大了。
您有两个选择：
将每组系数填充为16个值以保持对齐
对于未对齐的访问，请使用\u mm256\u loadu\u ps
内部命令
第一种选择的速度效率更高，而第二种选择的空间效率更高。
我想你的意思是I=0
和I=1
，而不是n
。至于对齐，您实际上只有几个选择：要么将结构填充到16个值以保持对齐，要么对未对齐的加载使用\u mm256\u loadu\u ps
。非常感谢您的建议！我还没见过这个！代码是有效的（是的，我的意思是I，而不是n。好的，我会把它转换成一个答案。




[c]相关文章推荐



                                                        
C 为什么字符串比较失败？
c 
C语言中64位编译的检测
clinuxunixgcc 
C 为什么编译器版本出现在我的ELF可执行文件中？
clinuxgcc 
C 在Linux消息队列的接收方上放什么键？
clinux 
我真的需要libgcc吗？
cmacoscocoagcc 
如何在C中为gtk窗口获取gdk窗口？
cgtk 
Openssl:RSA_verify（）和X509_verify_cert（）是否使用常见的RSA验证代码
clinuxopenssl 
C 类型转换为未定义类型的结构
cstructio 
使用fprintf调试调用C DLL的MFC程序
cmfc 
C 我的typedef有100个错误
c 
C 错误：之前应为说明符限定符列表
ccompiler-errors 
C程序中的奇异输出
cgcc 
使用反勾号编译GTK app cmd窗口
ccmd 
错误C2447:&x27；{'；：缺少函数头-'；无法解决此错误，有什么问题？
#包括
#包括
#包括
#包括
#包括“bcio2.h”
整数误差，x；
字符总脉冲[80]，平均脉冲[80]；
void validate_number（）；
内部主（空）
{
clrsc（）；
做{
printf（“\n总脉冲交付：”）；
获取（总脉冲）；
验证_编号（）；
}while（错误！=0）；
printf（“您输入的%d是有效的\n”，x）；
getch（）；
返回0；
}
{//错误C2447
cfunctionvalidationinput 
如何在c中检查用户输入的数据类型，如int、double和string
c 
C 具有链接时间优化的未定义引用
cgcccmake 
从c中的字符输入添加十六进制值
c 
如何在Doxygen中正确使用EXCLUDE_符号
cdoxygen 
C 如何将.txt文件中的行读取到两个单独的缓冲区中？
cfile-io 
C if语句中的Float返回负值，而不是给定值
c 
                                       





随机文章推荐



                                                        
Cryptography 您应该在ipsec中验证初始化向量吗？
cryptography 
Cryptography 捕获式门户认证理论
cryptography 
Cryptography AVR加密库中的AES函数未编译
cryptography 
Cryptography 重置用户密码。这个原则行吗？
cryptographysails.js 
Cryptography Rampart 1.6.2加载加密属性时出错
cryptography 
Cryptography 从散列创建PKCS7
cryptography 
Cryptography 什么是FreeBSD MD5？为什么它以非十六进制表示法生成哈希？
cryptography 
Cryptography 如何在windows中创建pkcs11库
cryptography 
Cryptography HMAC实现-伪代码
cryptography 
Cryptography 密封库中的分数编码器？
cryptography 
Cryptography 带以太坊的高清钱包地址生成器
cryptographyethereum 
Cryptography 沙米尔'；s秘密共享：每个碎片可以单独签署一个交易吗？
cryptography


                                        

                                        
                                        


                                                
                                                        [c++]相关推荐
                                                        
                                                        
                                                

                                                
                                                        Tags
                                                        
Electron
Fortran
Windows Installer
Jmeter
Applescript
String
Windows 10
Tinymce
Visual Studio Code
Nginx
Openid
Iphone
Json
Pdf
Deployment
Autodesk Forge
Install4j
.net Core
Rxjs
Blackberry
Performance
Soap
Iframe
Openerp
Graphics
Extjs
Couchbase
Xpath
Rally
Openstack
Gps
Lucene
Lisp
Jar
Domain Driven Design
Stream
Image
Command Line
Rust
Here Api
For Loop
Migration
Django Models
Tableau Api
Loopbackjs
Logic
Dictionary
Error Handling
Windows 7
Android Fragments
Sparql
Https
Sap
Doctrine Orm
Tensorflow
Swagger
Abap
Sharepoint 2007
Ios8
Excel
Zsh
Moodle
Android Emulator
Java
Utf 8
Sqlite
Tcp
Google Colaboratory
Log4net
Entity Framework 4
Apache Nifi
Outlook
Tcl
Asp.net
Blazor
Isabelle
Netbeans
Github
Clang
Single Sign On
Testng
Iis 7
Timer
Modelica
Google Maps Api 3
Rss
Build
Plot
Cloud Foundry
Concurrency
Jupyter Notebook
C
Svg
Sdk
Autohotkey
Function
Phpstorm
Wso2
Windows Phone 8
Entity Framework
Bison
Functional Programming
Apache Camel
Frameworks
Animation
Vector
Azure Ad B2c
Scheme
Tree
Menu
Spring Batch
Composer Php
Formatting
Wcf
Discord.js
Mfc
Gis
Actions On Google
Autocomplete
Fonts
Google Compute Engine
Phantomjs
Matplotlib
Dataframe
Module
Gremlin
Unix
Nosql
Ruby On Rails 3
Webpack
Jvm
Log4j
Hyperledger Fabric
Ignite
Scrapy
Python 3.x
Artifactory
Virtual Machine
Drupal 6
Ios5
Quickbooks
Yocto
Go
Algorithm
Report
Vb.net
Ckeditor
Properties
Cocos2d Iphone
Pine Script
Winapi
Python Sphinx
Inno Setup
Ruby On Rails
Csv
Liferay
Azure Cosmosdb
Amazon Redshift
Mvvm
Amazon S3
Design Patterns
Snmp
Uwp
Compression
Sql
Gmail
Prometheus
Teamcity
Ffmpeg
Docker
Azure Service Fabric
Facebook
Directx
Server
Appium
Firebase
Activerecord
Angular Material
Mariadb
Telegram
Visual Studio 2015
Hybris
Keras
Elm
Language Agnostic
React Native
Netty
Google Cloud Storage
Chart.js
Exception
Pycharm
Android Ndk
Aframe
Sql Server 2005
Oauth 2.0
Alfresco
Ms Word
Windows Phone 8.1
Jquery
Vagrant
Ruby On Rails 3.2


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网