FFmpeg

mirror of https://github.com/xenia-project/FFmpeg.git synced 2024-12-18 09:07:49 +00:00

History

Martin Storsjö 0ea603203d arm: vp9itxfm16: Make the larger core transforms standalone functions This work is sponsored by, and copyright, Google. This reduces the code size of libavcodec/arm/vp9itxfm_16bpp_neon.o from 17500 to 14516 bytes. This gives a small slowdown of a couple tens of cycles, up to around 150 cycles for the full case of the largest transform, but makes it more feasible to add more optimized versions of these transforms. Before: Cortex A7 A8 A9 A53 vp9_inv_dct_dct_16x16_sub4_add_10_neon: 4237.4 3561.5 3971.8 2525.3 vp9_inv_dct_dct_16x16_sub16_add_10_neon: 6371.9 5452.0 5779.3 3910.5 vp9_inv_dct_dct_32x32_sub4_add_10_neon: 22068.8 17867.5 19555.2 13871.6 vp9_inv_dct_dct_32x32_sub32_add_10_neon: 37268.9 38684.2 32314.2 23969.0 After: vp9_inv_dct_dct_16x16_sub4_add_10_neon: 4375.1 3571.9 4283.8 2567.2 vp9_inv_dct_dct_16x16_sub16_add_10_neon: 6415.6 5578.9 5844.6 3948.3 vp9_inv_dct_dct_32x32_sub4_add_10_neon: 22653.7 18079.7 19603.7 13905.3 vp9_inv_dct_dct_32x32_sub32_add_10_neon: 37593.2 38862.2 32235.8 24070.9 Signed-off-by: Martin Storsjö <martin@martin.st>		2017-03-19 22:54:19 +02:00
..
aac.h
aacpsdsp_init_arm.c
aacpsdsp_neon.S
ac3dsp_arm.S
ac3dsp_armv6.S
ac3dsp_init_arm.c
ac3dsp_neon.S
asm-offsets.h
audiodsp_arm.h
audiodsp_init_arm.c
audiodsp_init_neon.c
audiodsp_neon.S
blockdsp_arm.h
blockdsp_init_arm.c
blockdsp_init_neon.c
blockdsp_neon.S
cabac.h
dca.h
fft_fixed_init_arm.c
fft_fixed_neon.S
fft_init_arm.c
fft_neon.S
fft_vfp.S
flacdsp_arm.S
flacdsp_init_arm.c
fmtconvert_init_arm.c
fmtconvert_neon.S
fmtconvert_vfp.S
g722dsp_init_arm.c
g722dsp_neon.S
h264chroma_init_arm.c
h264cmc_neon.S	avcodec: fix vc1dsp dependencies	2016-09-25 13:11:45 +02:00
h264dsp_init_arm.c
h264dsp_neon.S
h264idct_neon.S
h264pred_init_arm.c
h264pred_neon.S
h264qpel_init_arm.c
h264qpel_neon.S
hevcdsp_arm.h
hevcdsp_deblock_neon.S
hevcdsp_idct_neon.S	Merge commit '1bd890ad173d79e7906c5e1d06bf0a06cca4519d'	2017-01-31 15:31:34 +01:00
hevcdsp_init_arm.c
hevcdsp_init_neon.c	Merge commit '1bd890ad173d79e7906c5e1d06bf0a06cca4519d'	2017-01-31 15:31:34 +01:00
hevcdsp_qpel_neon.S
hpeldsp_arm.h
hpeldsp_arm.S
hpeldsp_armv6.S
hpeldsp_init_arm.c
hpeldsp_init_armv6.c
hpeldsp_init_neon.c
hpeldsp_neon.S
idct.h
idctdsp_arm.h
idctdsp_arm.S
idctdsp_armv6.S
idctdsp_init_arm.c
idctdsp_init_armv5te.c
idctdsp_init_armv6.c
idctdsp_init_neon.c
idctdsp_neon.S
int_neon.S
jrevdct_arm.S
lossless_audiodsp_init_arm.c
lossless_audiodsp_neon.S
Makefile	arm: Add NEON optimizations for 10 and 12 bit vp9 loop filter	2017-01-24 22:35:59 +02:00
mathops.h
mdct_fixed_neon.S
mdct_neon.S
mdct_vfp.S
me_cmp_armv6.S
me_cmp_init_arm.c
mlpdsp_armv5te.S
mlpdsp_armv6.S
mlpdsp_init_arm.c
mpegaudiodsp_fixed_armv6.S
mpegaudiodsp_init_arm.c
mpegvideo_arm.c
mpegvideo_arm.h
mpegvideo_armv5te_s.S
mpegvideo_armv5te.c
mpegvideo_neon.S
mpegvideoencdsp_armv6.S
mpegvideoencdsp_init_arm.c
neon.S
neontest.c	avcodec: fix arguments on xmm/neon clobber test wrappers	2016-10-02 02:15:47 -03:00
pixblockdsp_armv6.S
pixblockdsp_init_arm.c
rdft_init_arm.c
rdft_neon.S
rv34dsp_init_arm.c
rv34dsp_neon.S
rv40dsp_init_arm.c
rv40dsp_neon.S
sbrdsp_init_arm.c
sbrdsp_neon.S
simple_idct_arm.S
simple_idct_armv5te.S	Merge commit '014852e932dab6e9cf2a53e7a17ce8321f3e922c'	2017-03-19 16:12:07 +01:00
simple_idct_armv6.S
simple_idct_neon.S
startcode_armv6.S
startcode.h
synth_filter_init_arm.c
synth_filter_neon.S
synth_filter_vfp.S
vc1dsp_init_arm.c
vc1dsp_init_neon.c
vc1dsp_neon.S
vc1dsp.h
videodsp_arm.h
videodsp_armv5te.S
videodsp_init_arm.c
videodsp_init_armv5te.c
vorbisdsp_init_arm.c
vorbisdsp_neon.S
vp3dsp_init_arm.c	Merge commit '6892df9294d93322d43255ada299507465bc93c8'	2017-03-19 18:41:26 +01:00
vp3dsp_neon.S
vp6dsp_init_arm.c	Merge commit '721d57e608dc4fd6c86f27c5ae76ef559d646220'	2017-03-19 17:15:24 -03:00
vp6dsp_neon.S
vp8_armv6.S
vp8.h
vp8dsp_armv6.S	Merge commit '802727b538b484e3f9d1345bfcc4ab24cfea8898'	2017-03-19 15:18:31 -03:00
vp8dsp_init_arm.c
vp8dsp_init_armv6.c
vp8dsp_init_neon.c
vp8dsp_neon.S	Merge commit 'e8b96a77010dd62624c3c65c357d7ae3b397ceaa'	2016-11-14 15:21:49 +01:00
vp8dsp.h
vp9dsp_init_10bpp_arm.c	arm: Add NEON optimizations for 10 and 12 bit vp9 MC	2017-01-24 22:35:50 +02:00
vp9dsp_init_12bpp_arm.c	arm: Add NEON optimizations for 10 and 12 bit vp9 MC	2017-01-24 22:35:50 +02:00
vp9dsp_init_16bpp_arm_template.c	arm: Add NEON optimizations for 10 and 12 bit vp9 loop filter	2017-01-24 22:35:59 +02:00
vp9dsp_init_arm.c	arm: vp9lpf: Implement the mix2_44 function with one single filter pass	2017-03-11 13:14:51 +02:00
vp9dsp_init.h	arm: Add NEON optimizations for 10 and 12 bit vp9 MC	2017-01-24 22:35:50 +02:00
vp9itxfm_16bpp_neon.S	arm: vp9itxfm16: Make the larger core transforms standalone functions	2017-03-19 22:54:19 +02:00
vp9itxfm_neon.S	arm/aarch64: vp9: Fix vertical alignment	2017-03-19 22:53:32 +02:00
vp9lpf_16bpp_neon.S	arm: Add NEON optimizations for 10 and 12 bit vp9 loop filter	2017-01-24 22:35:59 +02:00
vp9lpf_neon.S	arm/aarch64: vp9: Fix vertical alignment	2017-03-19 22:53:32 +02:00
vp9mc_16bpp_neon.S	arm: Add NEON optimizations for 10 and 12 bit vp9 MC	2017-01-24 22:35:50 +02:00
vp9mc_neon.S	arm: vp9mc: Calculate less unused data in the 4 pixel wide horizontal filter	2017-03-11 13:14:47 +02:00
vp56_arith.h