]> oss.titaniummirror.com Git - msp430-gcc.git/blobdiff - gmp/mpn/powerpc64/mode64/bdiv_dbm1c.asm
Imported gcc-4.4.3
[msp430-gcc.git] / gmp / mpn / powerpc64 / mode64 / bdiv_dbm1c.asm
diff --git a/gmp/mpn/powerpc64/mode64/bdiv_dbm1c.asm b/gmp/mpn/powerpc64/mode64/bdiv_dbm1c.asm
new file mode 100644 (file)
index 0000000..8c1e87e
--- /dev/null
@@ -0,0 +1,116 @@
+dnl  PPC64 mpn_bdiv_dbm1c.
+
+dnl  Copyright 2008 Free Software Foundation, Inc.
+
+dnl  This file is part of the GNU MP Library.
+
+dnl  The GNU MP Library is free software; you can redistribute it and/or modify
+dnl  it under the terms of the GNU Lesser General Public License as published
+dnl  by the Free Software Foundation; either version 3 of the License, or (at
+dnl  your option) any later version.
+
+dnl  The GNU MP Library is distributed in the hope that it will be useful, but
+dnl  WITHOUT ANY WARRANTY; without even the implied warranty of MERCHANTABILITY
+dnl  or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU Lesser General Public
+dnl  License for more details.
+
+dnl  You should have received a copy of the GNU Lesser General Public License
+dnl  along with the GNU MP Library.  If not, see http://www.gnu.org/licenses/.
+
+include(`../config.m4')
+
+C              cycles/limb
+C POWER3/PPC630:    6-18
+C POWER4/PPC970:    8.5
+C POWER5:           ?
+
+C TODO
+C  * Nothing to do...
+
+C INPUT PARAMETERS
+define(`rp', `r3')
+define(`up', `r4')
+define(`n',  `r5')
+define(`bd', `r6')
+define(`cy', `r7')
+
+ASM_START()
+PROLOGUE(mpn_bdiv_dbm1c)
+       ld      r0, 0(r4)
+
+       rldicl. r12, r5, 0,62
+       cmpldi  cr6, r12, 2
+       cmpldi  cr7, r5, 4
+       addi    r5, r5, 1
+       srwi    r5, r5, 2
+       mtctr   r5
+       beq     cr0, L(b00)
+       blt     cr6, L(b01)
+       beq     cr6, L(b10)
+
+L(b11):        mulld   r5, r0, r6
+       mulhdu  r12, r0, r6
+       ld      r0, 8(r4)
+       addi    r4, r4, -24
+       addi    r3, r3, -24
+       b       L(3)
+
+L(b00):        mulld   r9, r0, r6
+       mulhdu  r8, r0, r6
+       ld      r0, 8(r4)
+       addi    r4, r4, -16
+       addi    r3, r3, -16
+       b       L(0)
+
+L(b01):        mulld   r5, r0, r6
+       mulhdu  r12, r0, r6
+       addi    r3, r3, -8
+       ble     cr7, L(e1)
+       ld      r0, 8(r4)
+       addi    r4, r4, -8
+       b       L(1)
+
+L(b10):        mulld   r9, r0, r6
+       mulhdu  r8, r0, r6
+       ld      r0, 8(r4)
+       ble     cr7, L(e2)
+
+       ALIGN(16)
+L(top):        mulld   r5, r0, r6
+       mulhdu  r12, r0, r6
+       subfc   r11, r9, r7
+       ld      r0, 16(r4)
+       subfe   r7, r8, r11
+       std     r11, 0(r3)
+L(1):  mulld   r9, r0, r6
+       mulhdu  r8, r0, r6
+       subfc   r11, r5, r7
+       ld      r0, 24(r4)
+       subfe   r7, r12, r11
+       std     r11, 8(r3)
+L(0):  mulld   r5, r0, r6
+       mulhdu  r12, r0, r6
+       subfc   r11, r9, r7
+       ld      r0, 32(r4)
+       subfe   r7, r8, r11
+       std     r11, 16(r3)
+L(3):  mulld   r9, r0, r6
+       mulhdu  r8, r0, r6
+       subfc   r11, r5, r7
+       ld      r0, 40(r4)
+       subfe   r7, r12, r11
+       std     r11, 24(r3)
+       addi    r4, r4, 32
+       addi    r3, r3, 32
+       bdnz    L(top)
+
+L(e2): mulld   r5, r0, r6
+       mulhdu  r12, r0, r6
+       subfc   r11, r9, r7
+       subfe   r7, r8, r11
+       std     r11, 0(r3)
+L(e1): subfc   r11, r5, r7
+       std     r11, 8(r3)
+       subfe   r3, r12, r11
+       blr
+EPILOGUE()